Wednesday 25 October 2017

Série Autoregressive Moving Average


Existem várias abordagens para modelar séries temporais. Apresentamos algumas das abordagens mais comuns abaixo. Trend, Seasonal, Decomposições Residuais Uma abordagem é decompor as séries temporais em um componente de tendência, sazonal e residual. O abrandamento exponencial triplo é um exemplo desta abordagem. Outro exemplo, denominado loess sazonal, é baseado em mínimos quadrados localmente ponderados e é discutido por Cleveland (1993). Não discutimos o loess sazonal neste manual. Métodos baseados em frequência Outra abordagem, comumente usada em aplicações científicas e de engenharia, é analisar a série no domínio da freqüência. Um exemplo dessa abordagem na modelagem de um conjunto de dados de tipo sinusoidal é mostrado no estudo de caso de deflexão do feixe. O gráfico espectral é a ferramenta principal para a análise de freqüência de séries temporais. Modelos Autoregressivos (AR) Uma abordagem comum para modelar séries temporais univariadas é o modelo autorregressivo (AR): Xt delta phi1 X phi2 X cdots phip X At, onde (Xt) é a série temporal, (At) é ruído branco e delta Esquerda (1 - sum p phii right) mu. Com (mu) denotando o processo significa. Um modelo autorregressivo é simplesmente uma regressão linear do valor atual da série contra um ou mais valores anteriores da série. O valor de (p) é chamado de ordem do modelo AR. Os modelos AR podem ser analisados ​​com um dos vários métodos, incluindo técnicas de mínimos quadrados padrão padrão. Eles também têm uma interpretação direta. Modelos de média móvel (MA) Outra abordagem comum para a modelagem de modelos de séries temporais univariáveis ​​é o modelo de média móvel (MA): Xt mu At - theta1 A - theta2 A - cdots - thetaq A, onde (Xt) é a série temporal, (mu ) É a média da série, (A) são termos de ruído branco e (theta1, ldots,, thetaq) são os parâmetros do modelo. O valor de (q) é chamado de ordem do modelo MA. Ou seja, um modelo de média móvel é conceitualmente uma regressão linear do valor atual da série contra o ruído branco ou choques aleatórios de um ou mais valores anteriores da série. Os choques aleatórios em cada ponto são assumidos como provenientes da mesma distribuição, tipicamente uma distribuição normal, com localização em zero e escala constante. A distinção neste modelo é que esses choques aleatórios são propogados para valores futuros das séries temporais. Ajustar as estimativas de MA é mais complicado do que com os modelos AR porque os termos de erro não são observáveis. Isto significa que os procedimentos iterativos de encadernação não linear precisam ser usados ​​em lugar de mínimos quadrados lineares. Os modelos MA também têm uma interpretação menos óbvia do que os modelos AR. Às vezes, o ACF eo PACF sugerem que um modelo de MA seria uma escolha de modelo melhor e, por vezes, ambos os termos de AR e MA devem ser usados ​​no mesmo modelo (ver Seção 6.4.4.5). Note, no entanto, que os termos de erro após o ajuste do modelo devem ser independentes e seguir os pressupostos padrão para um processo univariado. Box e Jenkins popularizaram uma abordagem que combina a média móvel e as abordagens autorregressivas no livro Time Series Analysis: Forecasting and Control (Box, Jenkins e Reinsel, 1994). Embora as abordagens médias autorregressivas e móveis já tenham sido conhecidas (e foram originalmente investigadas por Yule), a contribuição de Box e Jenkins foi no desenvolvimento de uma metodologia sistemática para identificar e estimar modelos que poderiam incorporar ambas as abordagens. Isso faz modelos da Box-Jenkins uma classe de modelos poderosa. As próximas seções abordarão esses modelos em detalhes. Simulação de média móvel em movimento (Primeira ordem) A demonstração está configurada de tal forma que a mesma série aleatória de pontos é usada independentemente das constantes e variáveis. No entanto, quando o botão quotrandomizequot é pressionado, uma nova série aleatória será gerada e usada. Manter a série aleatória idêntica permite ao usuário ver exatamente os efeitos na série ARMA de mudanças nas duas constantes. A constante é limitada a (-1,1) porque a divergência da série ARMA resulta quando. A Demonstração é apenas para um processo de primeiro orden. Os termos AR adicionais permitiriam gerar séries mais complexas, enquanto outros termos MA aumentariam o alisamento. Para uma descrição detalhada dos processos ARMA, veja, por exemplo, G. Box, G. M. Jenkins e G. Reinsel, Time Series Analysis: Forecasting and Control. 3ª ed. Englewood Cliffs, NJ: Prentice-Hall, 1994. LINK RELACIONADO: média móvel agressiva Modelos ARMA (p, q) para análise de séries temporais - Parte 3 Esta é a terceira e última publicação na mini-série em modelos de média móvel auto-agressiva (ARMA) para Análise de séries temporais. Introduzimos modelos autoregressivos e modelos de média móvel nos dois artigos anteriores. Agora é hora de combiná-los para produzir um modelo mais sofisticado. Em última análise, isso nos levará aos modelos ARIMA e GARCH que nos permitirão prever os retornos dos ativos e prever a volatilidade. Esses modelos constituirão a base para sinais comerciais e técnicas de gerenciamento de risco. Se você ler a Parte 1 e a Parte 2, você verá que tendemos a seguir um padrão para a análise de um modelo de séries temporais. Vou repeti-lo brevemente aqui: Justificação - Por que estamos interessados ​​neste modelo particular Definição - Uma definição matemática para reduzir a ambigüidade. Correlograma - Traçando um correlograma de amostra para visualizar um comportamento de modelos. Simulação e montagem - Ajustando o modelo às simulações, para garantir que entendemos o modelo corretamente. Dados financeiros reais - Aplicar o modelo aos preços dos ativos históricos reais. Previsão - Preveja os valores subsequentes para construir sinais ou filtros comerciais. Para seguir este artigo, é aconselhável dar uma olhada nos artigos anteriores sobre análise de séries temporais. Todos podem ser encontrados aqui. Critério de Informação Bayesiano Na Parte 1 desta série de artigos, analisamos o Critério de Informação Akaike (AIC) como um meio de nos ajudar a escolher entre os melhores modelos de séries temporais. Uma ferramenta estreitamente relacionada é o Bayesian Information Criterion (BIC). Essencialmente, tem um comportamento semelhante ao AIC na medida em que penaliza os modelos por ter muitos parâmetros. Isso pode levar a uma superposição. A diferença entre o BIC e o AIC é que o BIC é mais rigoroso com a penalização de parâmetros adicionais. Critério de informação bayesiano Se tomarmos a função de verossimilhança para um modelo estatístico, que tem parâmetros k, e L maximiza a probabilidade. Então o critério de informação bayesiano é dado por: Onde n é o número de pontos de dados na série temporal. Usaremos o AIC e o BIC abaixo ao escolher os modelos ARMA apropriados (p, q). Teste de Ljung-Box Na Parte 1 desta série de artigos, Rajan mencionou nos comentários da Disqus que o teste de Ljung-Box era mais apropriado do que usar o Critério de Informação Akaike do Critério de Informação Bayesiano ao decidir se um modelo ARMA era um bom ajuste para um tempo Series. O teste de Ljung-Box é um teste de hipótese clássico projetado para testar se um conjunto de autocorrelações de um modelo de séries temporais ajustadas diferem significativamente de zero. O teste não prova cada atraso individual por aleatoriedade, mas prova a aleatoriedade sobre um grupo de atrasos. Teste de Ljung-Box Definimos a hipótese nula como: Os dados da série temporal em cada intervalo são i. i.d .. ou seja, as correlações entre os valores da série da população são zero. Definimos a hipótese alternativa como: Os dados da série temporal não são i. i.d. E possuem correlação em série. Calculamos a seguinte estatística de teste. Q: Onde n é o comprimento da amostra da série temporal, hat k é a autocorrelação da amostra no intervalo k e h é o número de atrasos no teste. A decisão determina se rejeitar a hipótese nula é verificar se Q gt chi2, para uma distribuição de qui-quadrado com h graus de liberdade no percentil 100 (1-alfa). Embora os detalhes do teste possam parecer um pouco complexos, podemos usar R para calcular o teste para nós, simplificando um pouco o procedimento. Média de Movimento Autogressivo (ARMA) Modelos de ordem p, q Agora que discutimos o BIC e o teste de Ljung-Box, estávamos prontos para discutir o nosso primeiro modelo misto, a saber, a Média Mover Autoregressiva da ordem p, q ou ARMA (p, Q). Até o momento consideramos processos autoregressivos e processos de média móvel. O modelo anterior considera seu próprio comportamento passado como insumos para o modelo e, como tal, tenta capturar os efeitos dos participantes do mercado, como o impulso e a reversão média na negociação de ações. O último modelo é usado para caracterizar informações de choque em uma série, como um anúncio de ganhos surpresos ou um evento inesperado (como o derramamento de óleo da BP Deepwater Horizon). Portanto, um modelo ARMA tenta capturar esses dois aspectos ao modelar séries temporais financeiras. Note-se que um modelo ARMA não leva em consideração o agrupamento de volatilidade, um fenômeno empírico chave de muitas séries temporais financeiras. Não é um modelo condicionalmente heteroscedástico. Para isso, precisamos aguardar os modelos ARCH e GARCH. Definição O modelo ARMA (p, q) é uma combinação linear de dois modelos lineares e, portanto, é ele mesmo ainda linear: Modelo Médio Autoregressivo da ordem p, q Um modelo de séries temporais, é um modelo médio vertical autorregressivo de ordem p, q . ARMA (p, q), se: begin xt alpha1 x alpha2 x ldots wt beta1 w beta2 w ldots betaq w end Onde é ruído branco com E (wt) 0 e variância sigma2. Se considerarmos o operador de deslocamento para trás. (Veja um artigo anterior) então podemos reescrever o acima como uma função theta e phi de: Nós podemos ver diretamente que, ao definir p neq 0 e q0, recuperamos o modelo AR (p). Da mesma forma, se definimos p 0 e q neq 0, recuperamos o modelo MA (q). Uma das principais características do modelo ARMA é que é parcimonioso e redundante em seus parâmetros. Ou seja, um modelo ARMA muitas vezes exigirá menos parâmetros do que um modelo AR (p) ou MA (q) sozinho. Além disso, se reescrevemos a equação em termos do BSO, então os polinômios theta e phi às vezes podem compartilhar um fator comum, levando a um modelo mais simples. Simulações e correlações Tal como acontece com os modelos de média autorregressiva e móvel, simularemos várias séries ARMA e tentamos ajustar os modelos ARMA a essas realizações. Realizamos isso porque queremos garantir que entendamos o procedimento de montagem, incluindo como calcular intervalos de confiança para os modelos, bem como garantir que o procedimento realmente recupere estimativas razoáveis ​​para os parâmetros ARMA originais. Na Parte 1 e na Parte 2, construímos manualmente a série AR e MA, desenhando N amostras de uma distribuição normal e, em seguida, elaborando o modelo de séries temporais específico usando atrasos dessas amostras. No entanto, há uma maneira mais direta de simular AR, MA, ARMA e até mesmo dados ARIMA, simplesmente usando o método arima. sim em R. Comece com o modelo ARMA não trivial mais simples possível, a saber, o ARMA (1,1 ) modelo. Ou seja, um modelo de ordem autorregressivo combinado com um modelo médio móvel da ordem um. Esse modelo tem apenas dois coeficientes, alfa e beta, que representam os primeiros atrasos da própria série de tempo e os termos de ruído branco de choque. Esse modelo é dado por: Precisamos especificar os coeficientes antes da simulação. Leve a alfa 0.5 e beta -0.5: A saída é a seguinte: Posicione também o correlograma: podemos ver que não há autocorrelação significativa, o que é de se esperar de um modelo ARMA (1,1). Finalmente, vamos tentar determinar os coeficientes e seus erros padrão usando a função arima: podemos calcular os intervalos de confiança para cada parâmetro usando os erros padrão: os intervalos de confiança contêm os valores dos parâmetros verdadeiros para ambos os casos, no entanto, devemos notar que o 95 intervalos de confiança são muito amplos (uma conseqüência dos erros padrão razoavelmente grandes). Vamos agora tentar um modelo ARMA (2,2). Ou seja, um modelo AR (2) combinado com um modelo MA (2). Precisamos especificar quatro parâmetros para este modelo: alpha1, alpha2, beta1 e beta2. Leve alpha1 0.5, alpha2-0.25 beta10.5 e beta2-0.3: A saída do nosso modelo ARMA (2,2) é a seguinte: E a autocorelação correspondente: agora podemos tentar ajustar um modelo ARMA (2,2) para Os dados: também podemos calcular os intervalos de confiança para cada parâmetro: Observe que os intervalos de confiança para os coeficientes para o componente da média móvel (beta1 e beta2) na verdade não contêm o valor do parâmetro original. Isso descreve o perigo de tentar ajustar os modelos aos dados, mesmo quando sabemos os valores dos parâmetros verdadeiros. No entanto, para fins comerciais, precisamos ter um poder preditivo que exceda as chances e produz lucro suficiente acima dos custos de transação, para ser rentável em A longo prazo. Agora que vimos alguns exemplos de modelos ARMA simulados, precisamos de um mecanismo para escolher os valores de p e q quando se adequa aos modelos a dados financeiros reais. Escolhendo o melhor modelo ARMA (p, q) Para determinar qual ordem p, q do modelo ARMA é apropriado para uma série, precisamos usar o AIC (ou BIC) em um subconjunto de valores para p, q e Em seguida, aplique o teste Ljung-Box para determinar se um bom ajuste foi alcançado, para valores particulares de p, q. Para mostrar este método, vamos simular primeiro um processo particular de ARMA (p, q). Em seguida, rolaremos todos os valores de p em p e q e calcularemos o AIC. Selecionaremos o modelo com o AIC mais baixo e depois executaremos um teste de Ljung-Box nos resíduos para determinar se conseguimos um bom ajuste. Comece simulando uma série ARMA (3,2): agora criaremos um objeto final para armazenar o melhor ajuste do modelo e o menor valor AIC. Atravessamos as várias combinações p, q e usamos o objeto atual para armazenar o ajuste de um modelo ARMA (i, j), para as variáveis ​​de loop i e j. Se o AIC atual for menor do que qualquer AIC previamente calculado, definimos o AIC final para esse valor atual e selecionamos essa ordem. Após o término do loop, temos a ordem do modelo ARMA armazenado em final. order e o ARIMA (p, d, q) se encaixa (com o componente d integrado configurado para 0) armazenado como final. arma: Permite a saída do AIC Coeficientes de ordem e ARIMA: podemos ver que a ordem original do modelo ARMA simulado foi recuperada, nomeadamente com p3 e q2. Podemos traçar o corelograma dos resíduos do modelo para ver se eles parecem uma realização de ruído branco discreto (DWN): O corelograma realmente parece uma realização de DWN. Finalmente, realizamos o teste Ljung-Box por 20 atrasos para confirmar isso: observe que o valor p é maior do que 0,05, o que indica que os resíduos são independentes no nível 95 e, portanto, um modelo ARMA (3,2) fornece um Bom ajuste do modelo. Claramente, este deve ser o caso, já que nós simulamos os dados. No entanto, este é precisamente o procedimento que usamos quando chegarmos para ajustar os modelos ARMA (p, q) ao índice SampP500 na seção a seguir. Dados financeiros Agora que descrevemos o procedimento para escolher o modelo da série temporal ideal para uma série simulada, é bastante direto aplicá-lo aos dados financeiros. Para este exemplo, vamos escolher mais uma vez o SampP500 US Equity Index. Permite baixar os preços de fechamento diários usando o quantmod e, em seguida, crie o fluxo de retorno de log: Realize o mesmo procedimento de montagem que para a série ARMA (3,2) simulada acima na série de retorna de registro do SampP500 usando o AIC: o modelo de melhor ajuste Tem ordem ARMA (3,3): permite traçar os resíduos do modelo ajustado para o fluxo de retorno diário SampP500: observe que há alguns picos significativos, especialmente em atrasos maiores. Isso é indicativo de um ajuste ruim. Vamos realizar um teste de Ljung-Box para ver se temos evidências estatísticas para isso: como nós suspeitamos, o valor p é menor que 0,05 e, como tal, não podemos dizer que os resíduos são uma realização de ruído branco discreto. Portanto, há autocorrelação adicional nos resíduos que não é explicada pelo modelo ARMA (3,3). Próximas Etapas Como já discutimos durante a série deste artigo, vimos evidências de heterocedasticidade condicional (aglomeração de volatilidade) na série SampP500, especialmente nos períodos de 2007-2008. Quando usamos um modelo GARCH mais tarde na série de artigos, veremos como eliminar essas autocorrelações. Na prática, os modelos ARMA nunca são geralmente bons ajustes para retornos de títulos de log. Precisamos levar em consideração a heterocedasticidade condicional e usar uma combinação de ARIMA e GARCH. O próximo artigo irá considerar ARIMA e mostrar como o componente integrado é diferente do modelo ARMA que consideramos neste artigo. Clique abaixo para aprender mais sobre. A informação contida neste site é a opinião dos autores individuais com base em sua observação pessoal, pesquisa e anos de experiência. A editora e seus autores não são conselheiros de investimento registrados, advogados, CPAs ou outros profissionais de serviços financeiros e não prestam assessoria jurídica, fiscal, contábil, de investimento ou outros serviços profissionais. A informação oferecida por este site é apenas de educação geral. Como cada situação factual de indivíduos é diferente, o leitor deve procurar seu próprio conselheiro pessoal. Nem o autor nem o editor assumem qualquer responsabilidade ou responsabilidade por quaisquer erros ou omissões e não devem ter responsabilidade nem responsabilidade para qualquer pessoa ou entidade em relação a danos causados ​​ou alegadamente causados ​​direta ou indiretamente pelas informações contidas neste site. Use por sua conta e risco. Além disso, este site pode receber compensações financeiras das empresas mencionadas através de publicidade, programas afiliados ou de outra forma. Taxas e ofertas de anunciantes exibidos neste site mudam com freqüência, às vezes sem aviso prévio. Enquanto nos esforçamos para manter informações precisas e oportunas, os detalhes da oferta podem estar desactualizados. Os visitantes devem assim verificar os termos de tais ofertas antes de participar delas. O autor e a editora não se responsabilizam por atualizar informações e negar a responsabilidade pelo conteúdo, produtos e serviços de terceiros, inclusive quando acessados ​​através de hiperlinks ou propagandas neste site.

No comments:

Post a Comment