Monday 24 July 2017

Erro De Predição Média Móvel


Evolução média móvel média. Como você pode imaginar, estamos olhando algumas das abordagens mais primitivas da previsão. Mas espero que este seja, pelo menos, uma introdução interessante para algumas das questões de informática relacionadas à implementação de previsões em planilhas. Nessa linha, continuaremos começando no início e começaremos a trabalhar com as previsões da Moeda em Movimento. Previsões médias móveis. Todos estão familiarizados com as previsões da média móvel, independentemente de acreditarem estar ou não. Todos os estudantes universitários fazem-no o tempo todo. Pense nos resultados do teste em um curso onde você terá quatro testes durante o semestre. Vamos assumir que você obteve um 85 no seu primeiro teste. O que você prever para o seu segundo resultado de teste O que você acha que seu professor prever para o seu próximo resultado de teste? O que você acha que seus amigos podem prever para o seu próximo resultado do teste? O que você acha que seus pais podem prever para o seu próximo resultado? Todos os blabbing que você pode fazer para seus amigos e pais, eles e seu professor provavelmente esperam que você consiga algo na área dos 85 que você acabou de receber. Bem, agora vamos assumir que, apesar de sua auto-promoção para seus amigos, você superestimar-se e imaginar que você pode estudar menos para o segundo teste e então você obtém um 73. Agora, o que todos os interessados ​​e desinteressados ​​vão Preveja que você obtém seu terceiro teste. Existem duas abordagens muito prováveis ​​para que eles desenvolvam uma estimativa, independentemente de compartilharem com você. Eles podem dizer a si mesmos, esse cara está sempre soprando fumaça sobre seus inteligentes. Hes vai ter outros 73 se tiver sorte. Talvez os pais tentem ser mais solidários e dizer, muito, até agora você obteve um 85 e um 73, então talvez você devesse entender sobre obter um (85 73) 2 79. Eu não sei, talvez se você fez menos festa E não mexia com a doninha em todo o lugar e se você começou a fazer muito mais estudando, você poderia obter uma pontuação mais alta. Duas dessas estimativas são, na verdade, previsões médias móveis. O primeiro está usando apenas o seu resultado mais recente para prever seu desempenho futuro. Isso é chamado de previsão média móvel usando um período de dados. O segundo é também uma previsão média móvel, mas usando dois períodos de dados. Vamos assumir que todas essas pessoas que estão se abalando na sua ótima mente ficaram chateadas e você decide fazer bem no terceiro teste por suas próprias razões e colocar uma pontuação maior na frente do quotalliesquot. Você faz o teste e sua pontuação é realmente um 89, todos, incluindo você, está impressionado. Então, agora você já fez o teste final do semestre e, como de costume, você sente a necessidade de incitar todos a fazer suas previsões sobre como você fará no último teste. Bem, espero que você veja o padrão. Agora, espero que você possa ver o padrão. O que você acredita é o Whistle mais preciso enquanto trabalhamos. Agora, retornamos à nossa nova empresa de limpeza, iniciada pela sua meia-irmã separada chamado Whistle While We Work. Você possui alguns dados de vendas passadas representados pela seção a seguir de uma planilha. Primeiro apresentamos os dados para uma previsão média móvel de três períodos. A entrada para a célula C6 deve ser Agora você pode copiar esta fórmula celular para as outras células C7 até C11. Observe como a média se move sobre os dados históricos mais recentes, mas usa exatamente os três períodos mais recentes disponíveis para cada previsão. Você também deve notar que não precisamos realmente fazer as previsões para os períodos passados ​​para desenvolver nossa previsão mais recente. Isso é definitivamente diferente do modelo de suavização exponencial. Eu incluí o quotpast predictionsquot porque vamos usá-los na próxima página da web para medir a validade da previsão. Agora, eu quero apresentar os resultados análogos para uma previsão média móvel de dois períodos. A entrada para a célula C5 deve ser Agora você pode copiar esta fórmula celular para as outras células C6 até C11. Observe como agora apenas as duas peças históricas mais recentes são usadas para cada previsão. Mais uma vez eu incluí as previsões quotpast para fins ilustrativos e para uso posterior na validação de previsão. Algumas outras coisas que são importantes para aviso prévio. Para uma previsão média móvel de m-período, apenas os valores de dados mais recentes são usados ​​para fazer a previsão. Nada mais é necessário. Para uma previsão média móvel de m-período, ao fazer previsões quotpast, observe que a primeira previsão ocorre no período m 1. Essas duas questões serão muito significativas quando desenvolvamos nosso código. Desenvolvendo a função de média móvel. Agora precisamos desenvolver o código para a previsão média móvel que pode ser usada de forma mais flexível. O código segue. Observe que as entradas são para o número de períodos que deseja usar na previsão e na matriz de valores históricos. Você pode armazená-lo em qualquer livro de trabalho que desejar. Função MovingAverage (Histórico, NumberOfPeriods) As Single Declarando e inicializando variáveis ​​Dim Item As Variant Dim Counter As Integer Dim Accumulation As Single Dim HistoricalSize As Integer Inicializando variáveis ​​Counter 1 Accumulation 0 Determinando o tamanho da matriz histórica HistoricalSize Historical. Count Para o contador 1 para NumberOfPeriods Acumulando o número apropriado dos valores mais recentes anteriormente observados Acumulação Acumulação Histórico (HistoricalSize - NumberOfPeriods Counter) MovingAverage Accumulation NumberOfPeriods O código será explicado na classe. Você deseja posicionar a função na planilha para que o resultado do cálculo apareça onde deveria gostar do seguinte. Na prática, a média móvel proporcionará uma boa estimativa da média da série temporal se a média for constante ou a mudança lenta. No caso de uma média constante, o maior valor de m dará as melhores estimativas da média subjacente. Um período de observação mais longo significará os efeitos da variabilidade. O objetivo de fornecer um m menor é permitir que a previsão responda a uma mudança no processo subjacente. Para ilustrar, propomos um conjunto de dados que incorpora mudanças na média subjacente das séries temporais. A figura mostra a série temporal usada para ilustração juntamente com a demanda média da qual a série foi gerada. A média começa como uma constante em 10. Começando no tempo 21, ela aumenta em uma unidade em cada período até atingir o valor de 20 no tempo 30. Então, torna-se constante novamente. Os dados são simulados adicionando à média, um ruído aleatório de uma distribuição Normal com média zero e desvio padrão 3. Os resultados da simulação são arredondados para o inteiro mais próximo. A tabela mostra as observações simuladas usadas para o exemplo. Quando usamos a tabela, devemos lembrar que em qualquer momento, apenas os dados passados ​​são conhecidos. As estimativas do parâmetro do modelo, para três valores diferentes de m, são mostradas em conjunto com a média das séries temporais na figura abaixo. A figura mostra a estimativa média móvel da média em cada momento e não a previsão. As previsões mudariam as curvas médias móveis para a direita por períodos. Uma conclusão é imediatamente aparente da figura. Para as três estimativas, a média móvel está atrasada por trás da tendência linear, com o atraso crescente com m. O atraso é a distância entre o modelo e a estimativa na dimensão temporal. Por causa do atraso, a média móvel subestima as observações à medida que a média está aumentando. O viés do estimador é a diferença em um momento específico no valor médio do modelo e o valor médio previsto pela média móvel. O viés quando a média está aumentando é negativo. Para uma média decrescente, o viés é positivo. O atraso no tempo e o viés introduzido na estimativa são funções de m. Quanto maior o valor de m. Maior a magnitude do atraso e do viés. Para uma série de crescimento contínuo com tendência a. Os valores de lag e tendência do estimador da média são dados nas equações abaixo. As curvas de exemplo não combinam essas equações porque o modelo de exemplo não está aumentando continuamente, antes ele começa como uma constante, muda para uma tendência e depois se torna constante novamente. Também as curvas de exemplo são afetadas pelo ruído. A previsão média móvel de períodos no futuro é representada pela mudança das curvas para a direita. O atraso e o desvio aumentam proporcionalmente. As equações abaixo indicam o atraso e a polarização de um período de previsão para o futuro em relação aos parâmetros do modelo. Novamente, essas fórmulas são para uma série de tempo com uma tendência linear constante. Não devemos nos surpreender com esse resultado. O estimador da média móvel é baseado na suposição de uma média constante, e o exemplo tem uma tendência linear na média durante uma parcela do período de estudo. Uma vez que as séries em tempo real raramente obedecerão exatamente aos pressupostos de qualquer modelo, devemos estar preparados para esses resultados. Também podemos concluir a partir da figura que a variabilidade do ruído tem o maior efeito para m menores. A estimativa é muito mais volátil para a média móvel de 5 do que a média móvel de 20. Temos os desejos conflitantes de aumentar m para reduzir o efeito da variabilidade devido ao ruído e diminuir m para tornar a previsão mais sensível às mudanças Em média. O erro é a diferença entre os dados reais e o valor previsto. Se a série temporal é verdadeiramente um valor constante, o valor esperado do erro é zero e a variância do erro é composta por um termo que é uma função e um segundo termo que é a variância do ruído,. O primeiro termo é a variância da média estimada com uma amostra de observações m, assumindo que os dados provêm de uma população com um meio constante. Este termo é minimizado fazendo m o maior possível. Um grande m faz com que a previsão não responda a uma mudança nas séries temporais subjacentes. Para tornar as previsões sensíveis às mudanças, queremos m o mais pequeno possível (1), mas isso aumenta a variação do erro. A previsão prática requer um valor intermediário. Previsão com o Excel O suplemento de previsão implementa as fórmulas de média móvel. O exemplo abaixo mostra a análise fornecida pelo suplemento para os dados da amostra na coluna B. As primeiras 10 observações são indexadas -9 a 0. Comparadas com a tabela acima, os índices do período são deslocados em -10. As primeiras dez observações fornecem os valores de inicialização para a estimativa e são usadas para calcular a média móvel para o período 0. A coluna MA (10) (C) mostra as médias móveis calculadas. O parâmetro médio móvel m está na célula C3. A coluna Fore (1) (D) mostra uma previsão para um período no futuro. O intervalo de previsão está na célula D3. Quando o intervalo de previsão é alterado para um número maior, os números na coluna Fore são deslocados para baixo. A coluna Err (1) (E) mostra a diferença entre a observação e a previsão. Por exemplo, a observação no tempo 1 é 6. O valor previsto feito a partir da média móvel no tempo 0 é 11,1. O erro então é -5.1. O desvio padrão e o Desvio Médico Médio (MAD) são calculados nas células E6 e E7, respectivamente. Médias móveis Médias móveis Com conjuntos de dados convencionais, o valor médio é geralmente o primeiro e um dos estatísticos de resumo mais úteis para calcular. Quando os dados estão na forma de uma série temporal, a série significa uma medida útil, mas não reflete a natureza dinâmica dos dados. Os valores médios calculados em períodos curtos, quer antes do período atual, quer centrados no período atual, são geralmente mais úteis. Uma vez que esses valores médios variam, ou se movem, à medida que o período atual se move do tempo t 2, t 3. etc., eles são conhecidos como médias móveis (Mas). Uma média móvel simples é (tipicamente) a média não ponderada de k valores anteriores. Uma média móvel ponderada exponencialmente é essencialmente a mesma que uma média móvel simples, mas com contribuições para a média ponderada pela proximidade com a hora atual. Como não há um, mas toda uma série de médias móveis para qualquer série, o conjunto de Mas pode ser plotado em gráficos, analisados ​​como uma série e usados ​​em modelagem e previsão. Uma série de modelos pode ser construída usando médias móveis, e estas são conhecidas como modelos MA. Se esses modelos forem combinados com modelos autorregressivos (AR), os modelos compostos resultantes são conhecidos como modelos ARMA ou ARIMA (o I é para integrado). Médias móveis simples Uma vez que uma série temporal pode ser considerada como um conjunto de valores, t 1,2,3,4, n a média desses valores pode ser calculada. Se assumirmos que n é bastante grande, e selecionamos um inteiro k, que é muito menor que n. Podemos calcular um conjunto de médias de bloco, ou médias móveis simples (da ordem k): cada medida representa a média dos valores de dados ao longo de um intervalo de observações k. Observe que o primeiro MA possível da ordem k gt0 é aquele para t k. Mais geralmente podemos soltar o subíndice extra nas expressões acima e escrever: Isto indica que a média estimada no tempo t é a média simples do valor observado no tempo t e as etapas de tempo precedentes de k-1. Se forem aplicados pesos que diminuam a contribuição das observações que estão mais longe no tempo, a média móvel é dita suavizada exponencialmente. As médias móveis são freqüentemente usadas como forma de previsão, pelo que o valor estimado para uma série no instante t 1, S t1. É tomado como MA durante o período até e inclusive o tempo t. por exemplo. A estimativa de hoje é baseada em uma média de valores registrados anteriores até e inclusive ontem (para dados diários). As médias móveis simples podem ser vistas como uma forma de suavização. No exemplo ilustrado abaixo, o conjunto de dados de poluição do ar mostrado na introdução deste tópico foi aumentado por uma linha de média móvel de 7 dias (MA), mostrada aqui em vermelho. Como pode ser visto, a linha MA suaviza os picos e as depressões nos dados e pode ser muito útil na identificação de tendências. A fórmula padrão de cálculo direto significa que os primeiros pontos de dados k -1 não possuem valor MA, mas, posteriormente, os cálculos se estendem ao ponto final de dados da série. PM10 valores médios diários, fonte de Greenwich: London Air Quality Network, londonair. org. uk Um dos motivos para o cálculo de médias móveis simples da maneira descrita é que permite que os valores sejam computados para todos os intervalos de tempo do tempo até o presente, e Como uma nova medida é obtida para o tempo t 1, o MA para o tempo t 1 pode ser adicionado ao conjunto já calculado. Isso fornece um procedimento simples para conjuntos de dados dinâmicos. No entanto, existem algumas questões com essa abordagem. É razoável argumentar que o valor médio nos últimos 3 períodos, por exemplo, deve estar localizado no tempo t -1, e não no tempo t. E para um MA em um número par de períodos, talvez ele deve estar localizado no meio do ponto entre dois intervalos de tempo. Uma solução para esta questão é usar cálculos de MA centrados, em que o MA no tempo t é a média de um conjunto simétrico de valores em torno de t. Apesar de seus méritos óbvios, essa abordagem não é geralmente usada porque requer que os dados estejam disponíveis para eventos futuros, o que pode não ser o caso. Nos casos em que a análise é inteiramente de uma série existente, o uso de Mas centrado pode ser preferível. As médias móveis simples podem ser consideradas como uma forma de suavização, eliminando alguns componentes de alta freqüência de uma série de tempo e destacando (mas não removendo) tendências de maneira similar à noção geral de filtragem digital. De fato, as médias móveis são uma forma de filtro linear. É possível aplicar uma computação média móvel a uma série que já foi suavizada, ou seja, suavizando ou filtrando uma série já suavizada. Por exemplo, com uma média móvel da ordem 2, podemos considerá-la como sendo calculada usando pesos, de modo que o MA em x 2 0,5 x 1 0,5 x 2. Do mesmo modo, o MA em x 3 0,5 x 2 0,5 x 3. Se nós Aplicar um segundo nível de suavização ou filtragem, temos 0,5 x 2 0,5 x 3 0,5 (0,5 x 1 0,5 x 2) 0,5 (0,5 x 2 0,5 x 3) 0,25 x 1 0,5 x 2 0,25 x 3, isto é, a filtragem de 2 estágios O processo (ou convolução) produziu uma média móvel simétrica ponderada de forma variável, com pesos. Várias convoluções podem produzir médias móveis bastante ponderadas, algumas das quais foram encontradas de particular uso em campos especializados, como nos cálculos do seguro de vida. As médias móveis podem ser usadas para remover efeitos periódicos se computado com o comprimento da periodicidade como conhecido. Por exemplo, com os dados mensais, as variações sazonais podem ser muitas vezes removidas (se este for o objetivo) aplicando uma média móvel simétrica de 12 meses com todos os meses ponderados igualmente, exceto o primeiro e o último que são ponderados por 12. Isso ocorre porque haverá Tenha 13 meses no modelo simétrico (tempo atual, t. - 6 meses). O total é dividido por 12. Procedimentos semelhantes podem ser adotados para qualquer periodicidade bem definida. Médias móveis ponderadas exponencialmente (EWMA) Com a fórmula média móvel simples: todas as observações são igualmente ponderadas. Se chamássemos esses pesos iguais, alfa t. Cada um dos pesos k seria igual a 1 k. Então a soma dos pesos seria de 1, e a fórmula seria: já vimos que as múltiplas aplicações desse processo resultam na variação dos pesos. Com médias móveis exponencialmente ponderadas, a contribuição para o valor médio de observações mais removidas no tempo é deliberada reduzida, enfatizando eventos mais recentes (locais). Essencialmente, um parâmetro de suavização, 0lt alfa lt1, é introduzido e a fórmula revisada para: Uma versão simétrica desta fórmula seria da forma: se os pesos no modelo simétrico forem selecionados como os termos dos termos da expansão binomial, (1212) 2q. Eles somarão para 1, e como q se tornar grande, irá se aproximar da distribuição Normal. Esta é uma forma de ponderação do kernel, com o Binomial atuando como a função kernel. A convolução de dois estágios descrita na subseção anterior é precisamente esse arranjo, com q 1, produzindo os pesos. Em suavização exponencial, é necessário usar um conjunto de pesos que somem para 1 e que reduzem de tamanho geométricamente. Os pesos utilizados são tipicamente da forma: Para mostrar que esses pesos somam para 1, considere a expansão de 1 como uma série. Podemos escrever e expandir a expressão entre parênteses usando a fórmula binomial (1- x) p. Onde x (1-) e p -1, o que dá: Isto fornece uma forma de média móvel ponderada da forma: esta soma pode ser escrita como uma relação de recorrência: o que simplifica bastante a computação e evita o problema de que o regime de ponderação Deve ser estritamente infinito para os pesos somarem para 1 (para valores pequenos de alfa. Isso geralmente não é o caso). A notação utilizada por diferentes autores varia. Alguns usam a letra S para indicar que a fórmula é essencialmente uma variável suavizada e escreve: enquanto a literatura da teoria do controle geralmente usa Z em vez de S para os valores exponencialmente ponderados ou suavizados (veja, por exemplo, Lucas e Saccucci, 1990, LUC1 , E o site NIST para mais detalhes e exemplos trabalhados). As fórmulas citadas acima derivam do trabalho de Roberts (1959, ROB1), mas Hunter (1986, HUN1) usa uma expressão da forma: que pode ser mais apropriada para uso em alguns procedimentos de controle. Com o alfa 1, a estimativa média é simplesmente seu valor medido (ou o valor do item de dados anterior). Com 0,5, a estimativa é a média móvel simples das medições atuais e anteriores. Em modelos de previsão o valor, S t. É freqüentemente usado como estimativa ou valor de previsão para o próximo período de tempo, ou seja, como a estimativa para x no tempo t 1. Assim, temos: Isso mostra que o valor de previsão no tempo t 1 é uma combinação da média móvel ponderada exponencialmente anterior Mais um componente que representa o erro de previsão ponderado, epsilon. No tempo t. Assumindo que uma série de tempo é fornecida e uma previsão é necessária, é necessário um valor para alfa. Isso pode ser estimado a partir dos dados existentes, avaliando a soma dos erros de predição quadrados, obtendo com valores variáveis ​​de alfa para cada t 2,3. Definindo a primeira estimativa para ser o primeiro valor de dados observado, x 1. Nas aplicações de controle, o valor de alfa é importante, isto é, é usado na determinação dos limites de controle superior e inferior e afeta o comprimento de execução médio (ARL) esperado Antes que esses limites de controle sejam quebrados (sob o pressuposto de que a série temporal representa um conjunto de variáveis ​​independentes aleatoriamente, distribuídas de forma idêntica com variância comum). Nessas circunstâncias, a variância da estatística de controle: é (Lucas e Saccucci, 1990): os limites de controle geralmente são estabelecidos como múltiplos fixos dessa variância assintótica, p. - 3 vezes o desvio padrão. Se alfa 0.25, por exemplo, e os dados que estão sendo monitorados assumem ter uma distribuição Normal, N (0,1), quando no controle, os limites de controle serão - 1.134 e o processo atingirá um ou outro limite em 500 etapas na média. Lucas e Saccucci (1990 LUC1) derivam os ARLs para uma ampla gama de valores alfa e sob vários pressupostos usando os procedimentos da Cadeia de Markov. Eles tabulam os resultados, incluindo o fornecimento de ARL quando a média do processo de controle foi deslocada por algum múltiplo do desvio padrão. Por exemplo, com uma mudança de 0,5 com alfa 0.25, o ARL tem menos de 50 etapas de tempo. As abordagens descritas acima são conhecidas como suavização exponencial única. Uma vez que os procedimentos são aplicados uma vez às séries temporais e, em seguida, os processos de análise ou controle são realizados no conjunto de dados suavizado resultante. Se o conjunto de dados incluir uma tendência e / ou componentes sazonais, o alisamento exponencial de dois ou três estágios pode ser aplicado como meio de remoção (modelagem explícita) desses efeitos (veja ainda mais a seção sobre Previsão abaixo e o exemplo do NIST). CHA1 Chatfield C (1975) The Analysis of Times Series: Teoria e Prática. Chapman and Hall, London HUN1 Hunter J S (1986) A média móvel ponderada exponencialmente. J of Quality Technology, 18, 203-210 LUC1 Lucas J M, Saccucci M S (1990) Esquemas de Controle Médio Médio Ponderado Exponencialmente: Propriedades e Melhorias. Technometrics, 32 (1), 1-12 ROB1 Roberts S W (1959) Testes de tabela de controle com base em médias móveis geométricas. Technometrics, 1, 239-250

No comments:

Post a Comment