Thursday, 22 March 2018

Movimentação média serial correlação


Teoria Econométrica Correlação Séria Há momentos, especialmente em dados de séries temporais, que a hipótese CLR de c o r r (t. T 1) 0, epsilon) 0 é quebrada. Isto é conhecido na econometria como Correlação Serial ou Autocorrelação. Isso significa que c o r r (t. T 1) 0, epsilon) neq 0 e há um padrão entre os termos de erro. Os termos de erro não são então distribuídos de forma independente nas observações e não são estritamente aleatórios. Exemplos de Autocorrelação Editar Quando o termo de erro está relacionado com o termo de erro anterior, ele pode ser escrito em uma equação algébrica. Onde é o coeficiente de autocorrelação entre os dois termos de perturbação, e u é o termo de perturbação para a autocorrelação. Isso é conhecido como um processo autorregressivo. O u é necessário dentro da equação porque, embora o termo de erro seja menos aleatório, ele ainda tem um ligeiro efeito aleatório. Correlação Serial da N-ésima Ordem Editar Modelo Autoregressivo Editar Processo Autoregressivo de Primeira Ordem, AR (1). Isto é conhecido como auto-regressão de primeira ordem, devido ao termo de erro somente dependendo do termo de erro anterior. N-ésimo Processo Autoregressivo, AR (n). A notação MA (q) refere-se ao modelo de média móvel de ordem q: X tti 1 qiti mu varepsilon soma theta varepsilon, onde o 1 . Q são os parâmetros do modelo, é a expectativa de X t (freqüentemente assumida como igual a 0), eo t. T 1. São novamente, termos de erro de ruído branco. O modelo de média móvel é essencialmente um filtro de resposta de impulso finito com alguma interpretação adicional colocada sobre ele. Autoregressivemoving-average model Edit A notação ARMA (p. Q) refere-se ao modelo com p termos autorregressivos e q termos de média móvel. Este modelo contém os modelos AR (p) e MA (q), X t c t i 1 p i X t i i 1 q i t i. Cvarepsilon sum varphi X soma theta varepsilon., Causas de autocorrelação Editar c o r r (t. T 1) 0, epsilon) neq 0 Autocorrelação espacial ocorre quando os dois erros são especialmente ou geograficamente relacionados. Em termos mais simples, eles estão ao lado de cada um. Exemplos: A cidade de St. Paul tem um pico de crime e assim eles contratam polícia adicional. No ano seguinte, descobriram que a taxa de criminalidade diminuiu significativamente. Surpreendentemente, a cidade de Minneapolis, que não havia ajustado sua força policial, descobre que eles têm um aumento na taxa de criminalidade durante o mesmo período. Nota: este tipo de Autocorrelação ocorre em amostras transversais. InertiaTime para ajustar Isso geralmente ocorre em macro, dados de séries temporais. A taxa de juros dos EUA aumenta inesperadamente e, portanto, há uma mudança associada nas taxas de câmbio com outros países. Alcançar um novo equilíbrio pode levar algum tempo. Influências prolongadas Esta é novamente uma macro, série de tempo série lidar com choques econômicos. Espera-se agora que a taxa de juros dos EUA aumente. As taxas de câmbio associadas irão lentamente ajustar-up até o anúncio pelo Federal Reserve e pode superar o equilíbrio. Dados SmoothingManipulation Usando funções para suavizar dados trará autocorrelação para os termos de perturbação Misspecification Uma regressão, muitas vezes, mostram sinais de autocorrelação quando há variáveis ​​omitidas. Como a variável independente ausente agora existe no termo de perturbação, obtemos um termo de perturbação que se parece com: t 2 X 2 ut beta X u quando a especificação correta é Y t 0 1 X 1 2 X 2 ut beta beta X beta X u Consequências da Autocorrelação Editar O principal problema com a autocorrelação é que ele pode fazer um modelo parecer melhor do que realmente é. Lista de conseqüências Editar Coeficientes ainda são imparciais E (t) 0. c o v (X t. U t) 0) cov (X, u) 0 A variância verdadeira de é aumentada pela presença de autocorrelações. A variância estimada de é menor devido à autocorrelação (inclinada para baixo). Uma diminuição em s e ()) e um aumento da t-estatísticas isto resulta no estimador que olha mais exato do que é realmente. R fica inflado. Todos esses problemas resultam em testes de hipóteses tornando-se inválido. Autocorrelação nos dados. 2 corridas, mas o verdadeiro OLS, que nunca teríamos encontrado, está em algum lugar no meio. Teste de Autocorrelação Editar Embora não seja conclusivo, uma impressão pode ser obtida através da visualização de um gráfico da variável dependente contra o termo de erro (ou seja, um residual scatter-parcela). Teste de Durbin-Watson: Assumir tt 1 ut epsilon rho u Teste H (0): 0 (sem AC) contra H (1): gt 0 (teste unilateral) Estatística do teste DW (tt 1) ​​2 2 2 2 - epsilon ) 2-2rho Qualquer valor em D (L) (na tabela DW) rejeita a hipótese nula e AC existe. Qualquer valor entre D (L) e D (W) nos deixa sem conclusão de AC. Qualquer valor maior que D (W) aceita a hipótese nula e AC não existe. Note, este é um teste de cauda. Para obter a outra cauda. Utilize 4 - DW como a estatística do teste. Média Móvel Integrada (p, d, q) Modelos para Análise de Série de Tempo No conjunto anterior de artigos (Partes 1, 2 e 3), entrámos em detalhes significativos sobre o AR ( P), MA (q) e ARMA (p, q) modelos de séries temporais lineares. Utilizamos esses modelos para gerar conjuntos de dados simulados, modelos ajustados para recuperar os parâmetros e, em seguida, aplicamos esses modelos aos dados das ações financeiras. Neste artigo vamos discutir uma extensão do modelo ARMA, ou seja, o modelo de média móvel integrada ou modelo ARIMA (p, d, q). Veremos que é necessário considerar o modelo ARIMA quando temos séries não-estacionárias. Tais séries ocorrem na presença de tendências estocásticas. Recapitulação Rápida e Próximas Etapas Até o momento, consideramos os seguintes modelos (os links o levarão aos artigos apropriados): Constantemente construímos nossa compreensão de séries temporais com conceitos como correlação serial, estacionário, linearidade, resíduos, correlogramas, Simulando, ajuste, sazonalidade, heterocedasticidade condicional e teste de hipóteses. Até agora ainda não realizamos previsão ou previsão de nossos modelos e por isso não tivemos nenhum mecanismo para produzir um sistema de negociação ou curva de patrimônio. Uma vez estudado ARIMA (neste artigo), ARCH e GARCH (nos próximos artigos), estaremos em posição de construir uma estratégia básica de negociação de longo prazo com base na previsão dos retornos do índice do mercado de ações. Apesar do fato de eu ter entrado em um monte de detalhes sobre os modelos que sabemos que em última análise não terá grande desempenho (AR, MA, ARMA), estamos agora bem versados ​​no processo de modelagem de séries temporais. Isso significa que, quando estudarmos modelos mais recentes (e até mesmo aqueles atualmente na literatura de pesquisa), teremos uma base de conhecimento significativa sobre a qual desenhar, a fim de efetivamente avaliar esses modelos, em vez de tratá-los como um turn key Prescrição ou caixa preta. Mais importante ainda, ele nos dará a confiança para estendê-los e modificá-los por conta própria e entender o que estamos fazendo quando o fazemos gostaria de agradecer por ter sido paciente até agora, como pode parecer que esses artigos estão longe de A ação real da negociação real. No entanto, a verdadeira investigação quantitativa de negociação é cuidadosa, medido e leva um tempo significativo para obter direito. Não há nenhuma correção rápida ou ficar rico esquema no comércio de quant. Estávamos quase prontos para considerar nosso primeiro modelo comercial, que será uma mistura de ARIMA e GARCH, por isso é imperativo que passemos algum tempo entendendo bem o modelo ARIMA. Uma vez que construímos nosso primeiro modelo de negociação, vamos considerar mais Modelos avançados, tais como processos de memória longa, modelos de espaço de estados (ou seja, o filtro de Kalman) e Vetor (VAR), que nos levarão a outras estratégias de negociação mais sofisticadas. Modelos ARIMA de ordem p, d, q Os modelos ARIMA são usados ​​porque podem reduzir uma série não-estacionária para uma série estacionária usando uma seqüência de etapas de diferenciação. Podemos recordar do artigo sobre ruído branco e passeios aleatórios que, se aplicarmos o operador diferença a uma série randômica aleatória (uma série não-estacionária) ficamos com ruído branco (uma série estacionária): begin nabla xt xt - x wt End ARIMA essencialmente executa esta função, mas faz isso repetidamente, d vezes, a fim de reduzir uma série não-estacionário para um estacionário. Para tratar outras formas de não estacionaridade além das tendências estocásticas, podem ser utilizados modelos adicionais. Os efeitos da sazonalidade (como os que ocorrem nos preços das commodities) podem ser abordados com o modelo ARIMA sazonal (SARIMA), porém não estaremos discutindo SARIMA muito nessa série. Efeitos heteroscedastic condicionais (como com agrupamento de volatilidade em índices de ações) podem ser abordados com ARCHGARCH. Neste artigo vamos considerar as séries não-estacionárias com tendências estocásticas e ajustar modelos ARIMA para estas séries. Também produziremos previsões para nossa série financeira. Definições Antes de definir os processos ARIMA precisamos discutir o conceito de uma série integrada: Série Integrada de ordem d Uma série temporal é integrada de ordem d. I (d), se: begin nablad xt wt end Isto é, se diferenciarmos a série d vezes recebemos uma série de ruído branco discreto. Alternativamente, usando o operador de mudança de marcha atrás, uma condição equivalente é: Agora que definimos uma série integrada, podemos definir o próprio processo ARIMA: Média Movente Integrada Autoregressiva Modelo de ordem p, d, q Uma série temporal é um modelo de média móvel integrada autorregressiva De ordem p, d, q. ARIMA (p, d, q). Se nablad xt é uma média móvel autorregressiva de ordem p, q, ARMA (p, q). Ou seja, se a série é diferenciada d vezes, e então segue um processo ARMA (p, q), então é uma série ARIMA (p, d, q). Se usarmos a notação polinomial da Parte 1 e Parte 2 da série ARMA, então um processo ARIMA (p, d, q) pode ser escrito em termos do Operador de Deslocamento para Trás. : Onde wt é uma série discreta de ruído branco. Há alguns pontos a observar sobre estas definições. Uma vez que a caminhada aleatória é dada por xt x wt, pode-se ver que I (1) é outra representação, uma vez que nabla1 xt wt. Se suspeitarmos de uma tendência não linear, então poderemos usar a diferenciação repetida (isto é, d gt 1) para reduzir uma série a ruído branco estacionário. Em R podemos usar o comando diff com parâmetros adicionais, p. Diff (x, d3) para realizar diferenças repetidas. Simulação, Correlograma e Ajuste do Modelo Já que já usamos o comando arima. sim para simular um processo ARMA (p, q), o procedimento a seguir será semelhante ao realizado na Parte 3 da série ARMA. A principal diferença é que vamos agora definir d1, ou seja, vamos produzir uma série de tempo não-estacionário com uma componente de tendência estocástica. Como antes vamos ajustar um modelo ARIMA aos nossos dados simulados, tentar recuperar os parâmetros, criar intervalos de confiança para estes parâmetros, produzir um correlograma dos resíduos do modelo ajustado e finalmente realizar um teste de Ljung-Box para estabelecer se temos um bom ajuste. Vamos simular um modelo ARIMA (1,1,1), com o coeficiente autorregressivo alfa0,6 eo coeficiente de média móvel beta-0,5. Aqui está o código R para simular e traçar tal série: Agora que temos nossa série simulada, vamos tentar ajustar um modelo ARIMA (1,1,1) a ele. Uma vez que conhecemos a ordem, simplesmente a especificamos no ajuste: Os intervalos de confiança são calculados como: Ambas as estimativas de parâmetros estão dentro dos intervalos de confiança e estão próximas dos valores dos parâmetros verdadeiros da série ARIMA simulada. Portanto, não devemos nos surpreender ao ver os resíduos parecerem uma realização de ruído branco discreto: Finalmente, podemos executar um teste de Ljung-Box para fornecer evidência estatística de um bom ajuste: Podemos ver que o valor de p é significativamente maior do que 0,05 e como tal podemos afirmar que existe forte evidência de discreto ruído branco sendo um bom ajuste para os resíduos. Assim, o modelo ARIMA (1,1,1) é um bom ajuste, como esperado. Dados Financeiros e Previsão Nesta seção vamos ajustar os modelos da ARIMA à Amazon, Inc. (AMZN) e ao SampP500 US Equity Index (GPSC, no Yahoo Finance). Faremos uso da biblioteca de previsão, escrita por Rob J Hyndman. Vamos em frente e instalar a biblioteca em R: Agora podemos usar o quantmod para baixar a série de preços diários da Amazon a partir do início de 2017. Como já teremos tomado as diferenças de primeira ordem da série, o ajuste ARIMA realizado em breve será Não requer d gt 0 para o componente integrado: Como na parte 3 da série ARMA, vamos agora fazer um loop através das combinações de p, d e q, para encontrar o melhor modelo ARIMA (p, d, q). Por ótima queremos dizer a combinação de ordem que minimiza o Critério de Informação Akaike (AIC): Podemos ver que uma ordem de p4, d0, q4 foi selecionada. Notavelmente d0, como já observamos as diferenças de primeira ordem acima: Se plotarmos o correlograma dos resíduos podemos ver se temos evidências de uma série de ruído branco discreto: Existem dois picos significativos, isto é, em k15 e k21, Esperam ver picos estatisticamente significativos simplesmente devido à variação de amostragem 5 do tempo. Vamos fazer um teste de Ljung-Box (ver artigo anterior) e ver se temos evidências de um bom ajuste: Como podemos ver o valor de p é maior que 0,05 e por isso temos evidências de um bom ajuste no nível 95. Podemos agora usar o comando de previsão da biblioteca de previsão para prever 25 dias de antecedência para a série de retornos da Amazon: Podemos ver as previsões de ponto para os próximos 25 dias com 95 (azul escuro) e 99 (azul claro) bandas de erro . Nós vamos usar essas previsões em nossa primeira estratégia de série de tempo de negociação quando chegarmos a combinar ARIMA e GARCH. Vamos executar o mesmo procedimento para o SampP500. Em primeiro lugar, obtemos os dados do quantmod eo convertemos para um fluxo diário de retorno de log: Ajustamos um modelo ARIMA fazendo um loop sobre os valores de p, d e q: A AIC nos diz que o melhor modelo é o ARIMA (2,0, 1). Observe mais uma vez que d0, como já fizemos as diferenças de primeira ordem da série: Podemos traçar os resíduos do modelo ajustado para ver se temos evidências de ruído branco discreto: O correlograma parece promissor, então o próximo passo é executar O teste de Ljung-Box e confirmar que temos um bom ajuste de modelo: Como o valor de p é maior que 0,05 temos evidências de um bom ajuste de modelo. Por que é que no artigo anterior nosso teste Ljung-Box para o SampP500 mostrou que o ARMA (3,3) era um ajuste fraco para o log diário Retorna que eu deliberadamente truncado os dados SampP500 para iniciar a partir de 2017 neste artigo , O que convenientemente exclui os períodos voláteis em torno de 2007-2008. Por isso, excluímos uma grande parte do SampP500 onde tínhamos um agrupamento de volatilidade excessivo. Isso afeta a correlação serial da série e, portanto, tem o efeito de fazer a série parecer mais estática do que foi no passado. Este é um ponto muito importante. Ao analisar as séries temporais, precisamos ter muito cuidado com as séries condicionalmente heteroscedasticas, como os índices do mercado de ações. Em finanças quantitativas, tentar determinar períodos de volatilidade diferente é muitas vezes conhecido como detecção de regime. É uma das tarefas mais difíceis de alcançar. Bem, discuta este ponto detalhadamente no próximo artigo quando chegarmos a considerar os modelos ARCH e GARCH. Vamos agora traçar uma previsão para os próximos 25 dias do SampP500 log diário retorna: Agora que temos a capacidade de ajustar e prever modelos como ARIMA, foram muito perto de ser capaz de criar indicadores de estratégia para a negociação. Próximas etapas No próximo artigo vamos dar uma olhada no generalizado Autoregressive condicional Heteroscedasticity (GARCH) modelo e usá-lo para explicar mais da correlação serial em certas ações e séries de índice de equidade. Uma vez discutido o GARCH, estaremos em posição de combiná-lo com o modelo ARIMA e criar indicadores de sinal e, portanto, uma estratégia de negociação quantitativa básica. Este é o terceiro e último post da mini-série sobre modelos de média móvel auto-regressiva (ARMA) para análise de séries temporais. Weve introduziu modelos autorregressivos e modelos de média móvel nos dois artigos anteriores. Agora é hora de combiná-los para produzir um modelo mais sofisticado. Em última análise, isso nos levará aos modelos ARIMA e GARCH que nos permitirão prever os retornos dos ativos e prever a volatilidade. Estes modelos constituirão a base para a negociação de sinais e técnicas de gestão de risco. Se você leu Parte 1 e Parte 2 você terá visto que tendemos a seguir um padrão para a nossa análise de um modelo de série de tempo. Ill repeti-lo brevemente aqui: Racional - Por que estamos interessados ​​neste modelo específico Definição - Uma definição matemática para reduzir a ambigüidade. Correlograma - Traçar um correlograma de amostra para visualizar o comportamento de um modelo. Simulação e Montagem - Ajustar o modelo a simulações, a fim de assegurar que o weve compreendeu o modelo corretamente. Dados financeiros reais - Aplicar o modelo aos preços dos ativos reais reais. Previsão - Previsão de valores subseqüentes para construir sinais de negociação ou filtros. Para seguir este artigo é aconselhável dar uma olhada nos artigos anteriores sobre a análise de séries temporais. Todos podem ser encontrados aqui. Critério Bayesiano de Informações Na Parte 1 deste artigo, analisámos o Critério de Informação Akaike (AIC) como um meio de nos ajudar a escolher entre os melhores modelos de séries temporais. Uma ferramenta estreitamente relacionada é o critério Bayesiano de Informação (BIC). Essencialmente, tem comportamento semelhante ao AIC, pois penaliza os modelos por terem muitos parâmetros. Isto pode conduzir a overfitting. A diferença entre o BIC eo AIC é que o BIC é mais rigoroso com a sua penalização de parâmetros adicionais. Critério Bayesiano de Informações Se tomarmos a função de verossimilhança para um modelo estatístico, que tenha k parâmetros, e L maximize a probabilidade. Então o critério Bayesiano de Informação é dado por: Onde n é o número de pontos de dados na série temporal. Usaremos o AIC eo BIC abaixo ao escolher modelos ARMA (p, q) apropriados. Ljung-Box Test Na Parte 1 deste artigo, Rajan mencionou nos comentários de Disqus que o teste de Ljung-Box era mais apropriado do que usar o Critério de Informação Akaike do Critério de Informação Bayesiano para decidir se um modelo ARMA era um bom ajuste para um tempo Series. O teste de Ljung-Box é um teste de hipóteses clássico que é projetado para testar se um conjunto de autocorrelações de um modelo de séries temporais ajustadas diferem significativamente de zero. O teste não testar cada atraso individual para aleatoriedade, mas sim testa a aleatoriedade sobre um grupo de defasagens. Teste de Ljung-Box Definimos a hipótese nula como: Os dados da série de tempo em cada lag são i. i.d .. isto é, as correlações entre os valores da série de população são zero. Definimos a hipótese alternativa como: Os dados da série de tempo não são i. i.d. E possuem correlação serial. Calculamos a seguinte estatística de teste. Q: Onde n é o comprimento da amostra de séries temporais, hat k é a autocorrelação da amostra com atraso k eh é o número de atrasos no teste. A regra de decisão sobre se rejeitar a hipótese nula é verificar se Q gt chi2, para uma distribuição qui-quadrado com h graus de liberdade no percentil 100 (1-alfa). Embora os detalhes do teste possam parecer um pouco complexos, podemos de fato usar R para calcular o teste para nós, simplificando um pouco o procedimento. Agora que discutimos o BIC eo teste de Ljung-Box, estávamos prontos para discutir o nosso primeiro modelo misto, ou seja, a Média Móvel Autoresgressiva de ordem p, q, ou ARMA (p, Q). Até o momento, consideramos processos autorregressivos e processos de média móvel. O modelo anterior considera seu próprio comportamento passado como insumos para o modelo e, como tal, tenta capturar efeitos de participantes no mercado, como momentum e reversão média na negociação de ações. O último modelo é usado para caracterizar informações de choque em uma série, como um anúncio de ganhos surpresa ou evento inesperado (como o derramamento de óleo BP Deepwater Horizon). Assim, um modelo ARMA tenta capturar ambos os aspectos ao modelar séries de tempo financeiro. Note-se que um modelo ARMA não leva em conta a volatilidade clustering, um fenômeno empírico chave de muitas séries financeiras. Não é um modelo condicionalmente heterocedástico. Para isso teremos de esperar pelos modelos ARCH e GARCH. Definição O modelo ARMA (p, q) é uma combinação linear de dois modelos lineares e, portanto, é ainda linear: Modelo de ordem temporal p, q Um modelo de série temporal, é um modelo de média móvel autorregressiva de ordem p, q . Onde está o ruído branco com E (wt) 0 e variância sigma2. Onde está o ruído branco com E (wt) 0 e variância sigma2. Se considerarmos o Backward Shift Operator. (Veja um artigo anterior), então podemos reescrever o acima como uma função theta e phi de: Podemos ver diretamente que, ao definir p neq 0 e q0, recuperamos o modelo AR (p). Da mesma forma, se definimos p 0 e q neq 0, recuperamos o modelo MA (q). Uma das principais características do modelo ARMA é que ele é parcimonioso e redundante em seus parâmetros. Ou seja, um modelo ARMA, muitas vezes, exigem menos parâmetros do que um modelo AR (p) ou MA (q) sozinho. Além disso, se reescrevemos a equação em termos do BSO, então os polinômios theta e phi podem às vezes compartilhar um fator comum, levando assim a um modelo mais simples. Simulações e Correlogramas Como com os modelos de média autorregressiva e móvel, vamos agora simular várias séries ARMA e, em seguida, tentar ajustar modelos ARMA a estas realizações. Nós realizamos isso porque queremos garantir que entendemos o procedimento de montagem, incluindo como calcular os intervalos de confiança para os modelos, bem como garantir que o procedimento realmente recuperar estimativas razoáveis ​​para os parâmetros ARMA original. Na Parte 1 e Parte 2 construímos manualmente as séries AR e MA tirando N amostras de uma distribuição normal e, em seguida, criando o modelo de série temporal específico usando atrasos dessas amostras. No entanto, há uma maneira mais simples de simular AR, MA, ARMA e ARIMA dados, simplesmente usando o método arima. sim em R. Vamos começar com o mais simples possível não trivial ARMA modelo, ou seja, o ARMA (1,1 ) modelo. Ou seja, um modelo autorregressivo de ordem um combinado com um modelo de média móvel de ordem um. Tal modelo tem apenas dois coeficientes, alfa e beta, que representam os primeiros desfasamentos da série de tempo em si e os termos de ruído de choque branco. Esse modelo é dado por: Precisamos especificar os coeficientes antes da simulação. Vamos tomar alpha 0,5 e beta -0,5: A saída é a seguinte: Vamos também traçar o correlograma: Podemos ver que não há autocorrelação significativa, o que é de esperar de um modelo ARMA (1,1). Finalmente, vamos tentar determinar os coeficientes e seus erros padrão usando a função arima: Podemos calcular os intervalos de confiança para cada parâmetro usando os erros padrão: Os intervalos de confiança contêm os valores dos parâmetros verdadeiros para ambos os casos, no entanto, 95 intervalos de confiança são muito amplos (uma consequência dos erros padrão razoavelmente grandes). Vamos agora tentar um modelo ARMA (2,2). Ou seja, um modelo AR (2) combinado com um modelo MA (2). Precisamos especificar quatro parâmetros para este modelo: alfa1, alfa2, beta1 e beta2. Vamos pegar alpha1 0.5, alpha2-0.25 beta10.5 e beta2-0.3: A saída do nosso modelo ARMA (2,2) é a seguinte: E a autocorelação correspondente: Agora podemos tentar montar um modelo ARMA (2,2) para Os dados: Também podemos calcular os intervalos de confiança para cada parâmetro: Observe que os intervalos de confiança para os coeficientes para a componente média móvel (beta1 e beta2) não contêm realmente o valor do parâmetro original. Contudo, para fins comerciais, precisamos apenas de um poder preditivo que exceda o acaso e produza lucros suficientes acima dos custos de transação, a fim de ser rentável em termos de custos. A longo prazo. Agora que temos visto alguns exemplos de modelos ARMA simulados, precisamos de um mecanismo para escolher os valores de p e q quando se encaixam nos modelos a dados financeiros reais. Escolhendo o melhor modelo ARMA (p, q) Para determinar qual ordem p, q do modelo ARMA é apropriado para uma série, precisamos usar o AIC (ou BIC) em um subconjunto de valores para p, q e Em seguida, aplicar o teste Ljung-Box para determinar se um bom ajuste foi alcançado, para valores específicos de p, q. Para mostrar este método, vamos primeiro simular um determinado processo ARMA (p, q). Em seguida, faremos um loop sobre todos os valores pairwise de p in e q in e calculamos o AIC. Vamos selecionar o modelo com o menor AIC e, em seguida, executar um teste de Ljung-Box sobre os resíduos para determinar se conseguimos um bom ajuste. Vamos começar simulando uma série ARMA (3,2): Agora vamos criar um objeto final para armazenar o melhor ajuste do modelo eo menor valor AIC. Percorremos as várias combinações p, q e usamos o objeto atual para armazenar o ajuste de um modelo ARMA (i, j), para as variáveis ​​looping i e j. Se o AIC atual for menor que qualquer AIC previamente calculado, definiremos o AIC final para este valor atual e selecionaremos essa ordem. Após a terminação do loop, temos a ordem do modelo ARMA armazenado em final. order e o ARIMA (p, d, q) se encaixa (com o componente d integrado definido como 0) armazenado como final. arma: Permite a saída do AIC , Ordem e coeficientes ARIMA: Podemos ver que a ordem original do modelo ARMA simulado foi recuperada, nomeadamente com p3 e q2. Podemos traçar o corelograma dos resíduos do modelo para ver se eles parecem uma realização de ruído branco discreto (DWN): O corelograma realmente parece uma realização de DWN. Finalmente, realizamos o teste de Ljung-Box para 20 lags para confirmar isso: Observe que o valor p é maior que 0,05, o que indica que os resíduos são independentes no nível 95 e, portanto, um modelo ARMA (3,2) Bom ajuste do modelo. No entanto, este é precisamente o procedimento que vamos usar quando chegarmos a ajustar modelos ARMA (p, q) para o índice SampP500 na seção a seguir. Dados Financeiros Agora que descrevemos o procedimento para escolher o modelo de série temporal ideal para uma série simulada, é bastante simples aplicá-lo aos dados financeiros. Para este exemplo, vamos escolher mais uma vez o SampP500 US Equity Index. Permite fazer o download dos preços de fechamento diários usando o quantmod e, em seguida, criar o fluxo de retorno do log: Permite executar o mesmo procedimento de ajuste que para a série ARMA (3,2) simulada acima no log retorna série do SampP500 usando o AIC: Tem a ordem ARMA (3,3): Permite traçar os resíduos do modelo ajustado para o fluxo de retorno diário do SampP500: Observe que há alguns picos significativos, especialmente em defasagens maiores. Isto é indicativo de um ajuste pobre. Vamos realizar um teste de Ljung-Box para ver se temos evidências estatísticas para isso: Como nós suspeitamos, o valor p é menor que 0,05 e, como tal, não podemos dizer que os resíduos são uma realização de ruído branco discreto. Portanto, há autocorrelação adicional nos resíduos que não é explicada pelo modelo ARMA (3,3). Próximas etapas Como discutimos ao longo desta série de artigos, vimos evidências de heterocedasticidade condicional (agrupamento de volatilidade) na série SampP500, especialmente nos períodos em torno de 2007-2008. Quando usamos um modelo GARCH mais tarde na série de artigos, veremos como eliminar essas autocorrelações. Na prática, os modelos ARMA nunca são geralmente bons ajustes para retorno de ações log. Precisamos levar em conta a heterocedasticidade condicional e usar uma combinação de ARIMA e GARCH. O próximo artigo irá considerar ARIMA e mostrar como o componente integrado difere do modelo ARMA que temos considerado neste artigo. Apenas começando com o modelo quantitativo TradingAR: Um modo de auto-regressão é uma regressão da variável contra si mesmo (valores passados ​​da variável de previsão). Um modelo autorregressivo de ordem p, AR (p) pode ser escrito como y t c 1 y t 1 2 y t 2 p y t p e t. Onde c é uma constante e e t é ruído branco. Modelo MA: Em contraste com o modelo AR, um modelo de média móvel usa erros de previsão passados ​​em um modelo de regressão. Um modelo de média móvel de ordem q, MA (q) pode ser escrito como y t c e t 1 e t 1 2 e t 2 q e t q. Onde e t é ruído branco. Em ambos os casos, o termo de erro é ruído branco. E a partir da fórmula acima, podemos ver claramente como os termos de erro são modelados de maneira diferente nos dois modelos. Em um modelo de AR, os valores retardados de y t são preditores. E o termo de erro e t no modelo é exatamente como o termo de erro em uma regressão linear múltipla. Em um modelo de MA, os erros de previsão passados ​​são preditores. Uma coisa a notar é que é possível escrever qualquer modelo AR (p) estacionário como um modelo de MA infinito, e um (inversível) MA (p) pode ser escrito como um AR infinito. FYI, você pode encontrar algumas descrições detalhadas do conceito em www2.sasproceedingssugi28252-28.pdf ea relação entre o modelo AR estacionário eo modelo MA em otexts. orgfpp84.

No comments:

Post a Comment