ArticlePDF Available

Modelo factorial dinámico threshold

February 2008
Revista Colombiana de Estadistica 31(2)

February 2008
31(2)

Source
RePEc

License
CC BY

Authors:

Daniel Peña

University Carlos III de Madrid

En este artículo se introduce el modelo factorial dinámico threshold, el cual permite analizar sistemas de series temporales que presenten comportamientos no lineales del tipo umbral. Se propone un método de estimación que combina el algoritmo EM con un procedimiento de búsqueda directa utilizando los algoritmos del filtro y de suavización de Kalman. El procedimiento estima factores comunes con comportamientos que cambian de régimen de acuerdo con una variable umbral.

Available via license: CC BY

Content may be subject to copyright.

Revista Colombiana de Estadística

Diciembre 2008, volumen 31, no. 2, pp. 183 a 192

Modelo factorial dinámico threshold

Threshold Dynamic Factor Model

María Elsa Correal

1,a

, Daniel Peña

2,b

Departamento de Ingeniería Industrial, Universidad de los Andes, Bogotá,

Colombia

Departamento de Estadística y Economía, Universidad Carlos III de Madrid,

Madrid, España

Resumen

En este artículo se introduce el modelo factorial dinámico threshold, el

cual permite analizar sistemas de series temporales que presenten comporta-

mientos no lineales del tipo umbral. Se propone un método de estimación que

combina el algoritmo EM con un procedimiento de búsqueda directa utili-

zando los algoritmos del ﬁltro y de suavización de Kalman. El procedimiento

estima factores comunes con comportamientos que cambian de régimen de

acuerdo con una variable umbral.

Palabras clave: series de tiempo no lineales, análisis factorial, modelo thresh-

old, algoritmo EM , ﬁltro de Kalman.

Abstract

This paper introduces a threshold dynamic factor model for the analysis

of vector time series which shows non-linear behavior of threshold type. We

propose an estimation procedure combining an EM algorithm with a grid

search procedure by the ways of the Kalman ﬁlter and smoothing recursions.

We estimate common latent threshold factors that may explain the dynamic

relationships within the group of variables.

Key words: Nonlinear time series, Factor analysis, Threshold model, EM

algorithm, Kalman ﬁlter.

1. Introducción

En este artículo se presenta un procedimiento para estimar factores comunes

en series temporales que presenten comportamientos no lineales del tipo threshold.

Profesora asociada. E-mail: mcorreal@uniandes.edu.co

Profesor catedrático. E- mail: dpena@est-econ.uc3m.es

183

184 María Elsa Correal & Daniel Peña

Tanto los procesos multivariados como la no linealidad c omprenden desarrollos

meto dológicos de especial interés dentro del estudio de series de tiempo. Uno de los

modelos no lineales para series de tiempo más difundido es el modelo autorreg resivo

umbral, T AR (Threshold AutoRegressive), propuesto inicialmente por Tong & Lim

(1980). Este modelo está representado mediante diferentes procesos autorregresivos

que se activan cuando determinada variable sobrepasa un valor umbral. El análisis

de los modelos T AR en el caso multivariado es más reciente. Tsay (19 98) es tal

vez el primero e n proponer un procedimiento de estimación y una prueba de no

linealidad para el caso vectorial. La inferencia estadística en los modelos thresh-

old ha sido estudiada entre otros por Hansen (1997, 2000), Gonzalo & Pitarakis

(2002) y, para el caso multivariado, por Tsay (19 98). Al igual que en los modelos

vectoriales V ARM A (Vector AutoRegressive-MovingAverage), en los modelos T AR

multivariados existen múltiples estructuras con características similares y no existe

una solución simple para la identiﬁcación de los parámetros. La proliferación de

parámetros puede ser tan alta como para hacer la estimación intratable en la

práctica. Un modelo factor ial no solamente reduce la dimensión del sistema, sino

que permite dejar al des cubierto componentes comunes a l conjunto de variables

que explican las interrelaciones existentes entre e llas. El modelo factorial dinámico

de Peña & Box (1987) representa las var iables obse rvadas mediante una suma de

dos componentes latentes ortogonales: una común a todas las variables, descrita

por un proceso ARMA (AutoRegressive-MovingAverage) de dimensión reducida;

y o tra especíﬁca a cada variable particular, que no está correlacionada con la

componente común. Este modelo inicialmente formulado para series estacionarias

ha sido generalizado a series no estacionarias en Peña & Poncela (2004, 2006);

recientemente se han pr e sentado técnicas para su identiﬁcación en Hu & Chou

(2004). Este modelo debe distinguirse del modelo factorial dinámico utilizado por

Sto ck & Watson (2002) y Forni et al. (2005), en el cual se asume que el número

de variables o la dimensión del sistema tiende a inﬁnito. La presencia o ausencia

de este supuesto es determinante en los pro c esos de identiﬁcación y estimación.

En el modelo factorial que se deﬁne en este trabajo no se hace este supuesto. El

objetivo de este trabajo es extender el modelo factorial dinámico de Peña y Box

para permitir tener en cuenta efectos no lineales del tipo umbral.

El modelo factorial dinámico threshold se deﬁne en la segunda sección del do-

cumento y sus propiedades se analizan en la tercera. En la cuarta se presenta el

méto do de estimació n. La estrategia consiste en realizar la es timac ión secuencial-

mente por co nce ntración de la función de verosimilitud, combinando el algoritmo

EM (Expectation-Maximization) con un método de búsqueda directa. En la quinta

sección, la metodología se aplica a un sistema de caudales de ríos colombianos en el

cual hay dos regímenes que se activa n mediante la variable del Índice de Oscilación

del Sur.

2. Formulación del modelo

Deﬁnición 1. Sea Z

una serie temporal k- dimensional, Z

= (z

, z

, . . . , z

)

′

con media cero. Diremos que Z

se representa mediante un modelo factorial di-

námico threshold con c r e gímenes de órdenes p

, p

, . . . , p

y variable umbral w

Revista Colombiana de Estadística 31 (2008) 183–192

Modelo factorial dinámico threshold 185







= Λf

+ u

;

i=1

(j)

t−i

+ Υ

(j)

, si w

t−d

∈ (γ

j−1

, γ

], j = 1, . . . , c.

(1)

donde w

es una va riable aleatoria unidimensional observable y e stacionaria, f

es un vector aleatorio r-dimensional no observable con media ce ro, u

es ruido

blanco k-dimensional con matriz de varianza-covarianza Σ

diagonal y deﬁnida

positiva, a

es un ruido blanco r-dimensional con matriz de varianza-covarianza la

identidad I

y tales que u

sea independiente de f

t−h

para h ≥ 0, a

independiente

de f

t−h

para h ≥ 1, { w

}, {u

} y {a

} independientes entre sí. Los parámetros del

modelo son los denominados parámetros umbral: −∞ = γ

< γ

< · · · < γ

c−1

= −∞, el entero positivo d, rezago de la va riable umbral, la matriz de carga

Λ, de dimensión (k × r) que debe s er tal que rango(Λ) = r y Λ

′

Λ = I

, I

matriz

identidad de or den r, y los parámetros que determinan la dinámica del factor,

(j)

, Υ

(j)

j = 1, . . . , c, matrices de dimensión (r × r), con Υ

(j)

diagonal y deﬁnida

positiva.

El modelo propuesto detecta componentes comunes no lineales que puedan ser

representadas por modelos umbral y q ue involucren la dinámica propia del sistema.

La idea general es represe ntar el vector temp oral mediante la suma de dos com-

ponentes la tentes ortogonales: una común a las componentes del vector, descrita

por un proceso vectorial autorregre sivo threshold T AR, de dimensió n menor, y

otra especíﬁca a cada componente particular. La variable umbral w puede ser una

de las componentes estacionaria s del vector observado, z

, j ≤ k, o una variable

exógena estacionaria que a fecte el estado del sistema, o una combinación de las

componentes de Z

. Esta combinación debe ser estaciona ria.

Mediante este modelo pueden salir a relucir características signiﬁcativas en un

régimen y no en el otro. El proceso formulado para los factores permite tener en

consideración autorregresiones con órdenes diferentes en los regímenes. La serie de

los factores es generada por procesos diferentes en diferentes instantes de tiempo;

su cambio es consecuencia de un estado del sistema que se mantiene hasta que

determinada variable s obrepasa un valor umbral.

3. Propiedades del modelo

3.1. Identiﬁcación

El modelo propuesto hereda los problemas de identiﬁcación presentes en el

modelo factorial estático debido a la no obse rvabilidad de f . La imp osición de una

estructura T AR con c regímenes para los factor e s no evita la no identiﬁcación de

los parámetros. Efectivamente, si f

es un T AR r-dimensio nal con c regímenes de

órdenes p

, . . . , p

y variable umbral w

, entonces para cualquier matriz (r × r)

no singular C, el vector f

∗

= Cf

será también un T AR r-dimensional para la

misma varia ble umbral, el mismo número de regímenes c y los mismos órdenes

Revista Colombiana de Estadística 31 (2008) 183–192

186 María Elsa Correal & Daniel Peña

autorregresivos dentro de cada régimen. Especíﬁcamente, f

∗

se expresa como

∗

i=1

∗(j)

∗

t−i

+ Υ

∗(j)

, si w

t−d

∈ (γ

j−1

, γ

], j = 1, . . . , c

donde φ

∗(j)

= Cφ

(j)

−1

y Υ

∗(j)

= CΥ

(j)

. Dicho de otra forma, para cualquier

matriz C no singular, los conjuntos

Λ, φ

(1)

, . . . , φ

(c)

, Υ

(1)

, . . . , Υ

(c)

, Σ

, d, γ

, . . . , γ

ΛC

−1

, Cφ

(1)

−1

, . . . , Cφ

(c)

−1

, CΥ

(1)

, . . . , CΥ

(c)

, Σ

, d, γ

, . . . , γ

no pueden distinguirse a partir de las observaciones.

Proposición 1. Las restricciones Λ

′

Λ = I

y Υ

(j)

matriz diagonal y positiva

deﬁnida para j = 1, . . . , c, eliminan esta fuente de indeterminación.

Demostración . En efecto, si Λ y Λ

∗

= ΛC

−1

satisfacen la primera restric-

ción, Λ

′

Λ = I

y (Λ

∗

)

′

∗

= (C

−1

)

′

−1

= I

, entonces C será matriz ortogo-

nal. Además, si Υ

(j)

y Υ

∗(j)

= CΥ

(j)

satisfacen la se gunda restricción, entonces

C = Υ

∗(j)

(Υ

(j)

)

−1

y, por tanto, C es diagonal. Puesto que la única matriz orto go-

nal y diagonal es la matriz identidad, se concluye que C = I

Vale la p e na mencionar que la representación T AR de los factores en el mo delo

factorial dinámico threshold (1) puede escribirse como f

i=1

(j)

t−i

+ a

(j)

con

(j)

= Υ

(j)

. Puede verse entonces que la matriz de varia nza covarianza de a

puede restring irse a la identidad sin pérdida de generalidad.

3.2. Estructura para las matrices de covarianza rezagadas

Las matric e s de covarianza para diferentes rezagos contienen informac ión acerca

de la dinámica de la s interrelaciones entre las diferentes co mpo nentes del proceso.

Sean Γ

(h) = E(Z

t−h

′

), Γ

(h) = E(f

t−h

′

) y Σ

(h) = E(u

t−h

′

) para h =

0, 1, 2, . . . las matrices de covarianza rezaga das de Z, f y u respec tiva mente.

Proposición 2. Si Z

se representa mediante un modelo autorregresivo threshold,

rango(Γ

(h)) = r, pa ra h = 1, 2, . . .

Demostración . En efecto, si f

es estacionario de segundo orden, Z

también lo

es, y puesto que Z

= Λf

+ u

, y u

es ruido blanco,

(h) = ΛΓ

(h)Λ

′

, para h = 1, 2 , . . .

Esta propiedad es muy útil en la etapa de identiﬁcación del número de factores

comunes.

Revista Colombiana de Estadística 31 (2008) 183–192

Modelo factorial dinámico threshold 187

3.3. Modelo de rezagos distribuidos por regímenes

Proposición 3. Z

puede ex presarse como un modelo de rezagos distribuidos por

regímenes

i=1

(j)

t−i

+ ε

(j)

, si w

t−d

∈ (γ

j−1

, γ

], j = 1, . . . , c

donde los espacios nulos de Λ

(j)

comparten un subespacio común de dimensión

(k − r).

Demostración . En efecto, remplazando la segunda ecuación de (1) en la pri-

mera se obtiene Λ

(j)

= Λφ

(j)

; por tanto, si M es una matriz k × (k − r) cu-

yas columnas generan el espacio nulo de Λ

′

, M

′

(j)

= 0 para i = 1, . . . , p

j = 1, . . . , c. Sin embargo, las matrices Λ

(j)

no necesariamente tienen rango com-

pleto y rango



(j)



= rango



(j)



El ruido asociado al modelo expresado en rezagos distribuidos es ε

(j)

ΛΥ

(j)

+ u

, y su matriz de covarianza, no necesariamente diagonal, viene dada

por

(j)

= ΛD

(j)

′

+ Ψ

, j = 1, . . . , c

con D

(j)

= Υ

(j)

matriz diagona l.

4. Estimación

Se propone estimar los parámetro s del modelo por máxima verosimilitud me-

diante un algoritmo que combina el principio del algoritmo EM con un método de

búsqueda directa. El procedimiento maximiza el logaritmo de la función de verosi-

militud L

de forma secuencial, primero sobre ψ



Λ, Φ

(1)

, Φ

(2)

, Υ

(1)

, Υ

(2)

, Σ



y luego sobre ψ

= {d, γ}. Para d y γ ﬁjos, el máximo sobre ψ

se obtiene mediante

un algoritmo EM . La utilización del algoritmo EM en el contexto de factores diná-

micos fue pro puesta inicialmente por Shumway & Stoﬀer (1982) y Watso n & Engle

(1983) y ha sido utilizada poster iormente por Wu et al. (19 96) y Peña & Poncela

(2006), entre otros. En la segunda eta pa, por búsqueda directa se encuentran los

valores

d y bγ que maximicen L

. La búsqueda se re aliza para d ∈ {1 , . . . ,

d},

d una

cota para el retardo y γ ∈ {γ

, . . . , γ

}, conjunto formado por los cuantiles mues-

trales de la variable umbral escogidos de forma tal que en cada régimen se tengan

suﬁcientes observaciones para estimar adecuadamente los parámetros asociados.

Siendo así las cosas, se tendrán que realizar

d L veces el procedimiento EM .

Revista Colombiana de Estadística 31 (2008) 183–192

188 María Elsa Correal & Daniel Peña

Para d y γ ﬁjos, el logaritmo de la función de verosimilitud de los datos com-

pletos, L

Z,f

(ψ

; ψ

), puede separarse por una función indicadora:

Z,f

(ψ

; ψ

) = cte −

log |Σ

| −

t=1

− Λf

)

′

−1

− Λf

)

−

t∈I

log



(1)



−

t∈I

log



(2)



−

t∈I

(d,γ)



t+1

− ϕ

(1)



′



(1)



−1



t+1

− ϕ

(1)



−

t∈I

(d,γ)



t+1

− ϕ

(2)



′



(2)



−1



t+1

− ϕ

(2)



donde I

(d, γ) =



t ∈ {1, . . . , T }/w

t−d

< γ



, I

(d, γ) =



t ∈ {1, . . . , T }/w

t−d

≥



, X

= (f

′

, f

′

t−1

, . . . , f

′

t−p+1

)

′

vector rp × 1, y ϕ

(i)



(i)



· · ·



(i)

matriz

r × rp, para i = 1, 2.

Utilizando la solución de la k- é sima iteración,

(k)

, la evalua c ión del paso E

del algoritmo



;

(k)



= E

(k)



Z,f

(ψ

; ψ

)



, . . . , Z

, w

, . . . , w



(2)

se obtiene involucrando los algoritmos del ﬁltro de Kalman y de suavización de

intervalo ﬁjo aplicados a una representación espacio-estado del modelo. Como r e -

sultado de este paso, se obtienen las sucesiones

(k)

t|T

, P

(k)

t|T

, M

(k)

t|T

, t = 1, . . . , T ,

donde

(k)

t|T

= E

(k)





, . . . , Z

, w

, . . . , w



(k)

t|T

= E

(k)



−

t|T



−

t|T



′



, . . . , Z

, w

, . . . , w

(k)

t|T

= E

(k)



t+1

−

t+1|T



−

t|T



′



, . . . , Z

, w

, . . . , w

Teniendo en cuenta que f

= S

′

para S

′



| 0

| · · · | 0



, también se

obtienen las sucesiones

(k)

t|T

= E

(k)





, . . . , Z

, w

, . . . , w



= S

′

(k)

t|T

(k)



′



, . . . , Z

, w

, . . . , w



= S

′



(k)

t|T

(k)

t|T

(k)′

t|T



(k)



t+1

′



, . . . , Z

, w

, . . . , w



= S

′



(k)

t|T

(k)

t|T

(k)′

t|T



Revista Colombiana de Estadística 31 (2008) 183–192

Modelo factorial dinámico threshold 189

En la k-ésima iteración del paso M del algoritmo s e maximiza Q



;

(k)



con

respecto a ψ

. Se mostrará a continuación que la solución viene dada por

(k+1)

t=1

(k)′

t|T

t=1

(k)

t|T

(k)′

t|T

+ P

(k)

−1

(k+1)

t=1



−

(k+1)

(k)

t|T



−

(k+1)

(k)

t|T



′

(k+1)

(k)

′

(k+1)

eϕ

(j)

(k+1)

t∈I

(k)

t+1|T

(k)′

+ V

(k)

t∈I

(k)

t+1|T

(k)′

t+1|T

+ W

(k)

−1

, j = 1, 2

(j)

(k+1)

t∈I



(k)

t+1|T

− eϕ

(j)

(k+1)

(k)



′



(k)

t+1|T

− eϕ

(j)

(k+1)

(k)



+ eϕ

(j)

(k+1)

(k)

eϕ

(j)

(k+1)

donde T

número de casos en el régimen j y las matrices P

(k)

, V

(k)

y W

(k)

están

dadas por

(k)

t=1

′

(k)

t|T

S, V

(k)

t∈I

′

(k)

t|T

, W

(k)

t∈I

′

(k)

t|T

para S

′



| 0

| · · · | 0



En efecto, el término que involucra a Λ en (2) es

t=1



− Λf



′

−1



− Λf





, . . . , Z

, w

, . . . , w

que es igual a

traza

−1

t=1



′

− Λ

(k)

t|T

′

− Z

(k)′

t|T

′

+ Λ



(k)

t|T

(k)′

t|T

+ S

′

(k)

t|T



′



y, por tanto,

∂Q

∂Λ

= −Σ

−1

t=1

(k)′

t|T

+ Σ

−1

t=1



(k)

t|T

(k)′

t|T

+ S

′

(k)

t|T



Igualando a ce ro este sistema de derivadas parciales, se obtiene el resultado

para

(k+1)

Ahora, ﬁjando

(k+1)

, la parte de E



Z,f

(ψ

; ψ

)



, . . . , Z

, w

, . . . , w



que

involucra a Σ

puede escribirse como

log |Σ

| −

traza

−1

t=1





−

(k+1)

(k)

t|T



−

(k+1)

(k)

t|T



′

(k+1)

′

(k)

t|T

(k+1)



Revista Colombiana de Estadística 31 (2008) 183–192

190 María Elsa Correal & Daniel Peña

y entonces va le el resultado para

(k+1)

El resultado para eϕ

(j)

(k+1)

(j)

(k+1)

se prueba de forma similar. En este caso, apa-

rece E(f

t+1

), que involucra a V

(k)

= S

′

(k)

t|T

. Más detalles pueden consultarse

en Correal (2007).

El algoritmo proporcio na también el e stimador óptimo de los factores:

t|T

= E



| Z

, . . . , Z

, w

, . . . , w



5. Aplicación

El modelo y el método de estimación se aplican a un vector de dimensión 5 con-

formado po r los caudales de lo s ríos colombianos Calima, Cauca, Grande, Ovejas y

Prado, que pertenecen a la cuenca del Magdalena. Los datos históricos disponibles

abarcan un pe riodo de 36 años y corresponden al per iodo compre ndido entre enero

de 1955 y diciembre de 19 90, para un total de 432 observaciones mensuales.

El procedimiento se realizó en tres etapas resumidas a continuación. Los re-

sultados detallados pueden consultarse en Correal (2007). En la primera se probó

la hipótesis de que los caudales pres e ntan un comportamiento no lineal del tipo

threshold con variable umbral Índice de Oscilación del Sur, IOS, variable atmos-

férica relacionada con el evento climático del fenómeno de El Niño. La hipótesis se

contrastó mediante el test propuesto por Tsay (1989). Este se basa en autorregre-

siones reordenadas de acuerdo con la variable umbral w

t−d

. El test se aplicó para

los r e tardos d = 1, 2, . . . , 12 y pa ra los datos z

= (1 − θB

)

−1

(1 − B

) log c

i = 1, . . . , 5; c

caudal del i−ésimo río en el instante t. De los nueve río s conside-

rados originalmente, los cinco utilizados en esta aplicación dieron signiﬁcativos.

En la segunda etapa, se procedió a identiﬁcar el número de factores comunes.

Para esto se realizaron dos pruebas, ambas basadas en los vectores propios de

las matrices de autocovar ianza rezagadas observadas Γ

(k) = E(Z

t−k

′

), y cu-

yos detalles pueden cons ulta rse en Peña & Poncela (2006) y Hu & Chou (2004).

Los resultados de estas pr uebas llevaron a plantear un modelo con dos factores

comunes.

En la tercera etapa se implementó el algoritmo para estimar los parámetros del

modelo. El algoritmo de búsqueda se realizó sobre el par de conjuntos {1, 2, . . . , 12}

para d y {−2.6, −2.5, . . . , 2.3} para γ, con lo que el algoritmo EM se corrió 60

veces.

El estimador del valor umbral fue bγ = −2.3. Puesto que los episodio s del

fenómeno de El Niño se presentan acompañados de valores nega tivos del Índice de

Oscilación al Sur, el régimen 1 puede asociars e a una de las fases del fenómeno.

El resultado para el rezago fue

d = 1 y la estimación para la matriz de carga del

modelo factorial dinámico threshold es

Λ =



0.29 0.54 0.34 0.47 0.52

0.94 −0.05 −0.06 −0.23 −0.22



′

Revista Colombiana de Estadística 31 (2008) 183–192

Modelo factorial dinámico threshold 191

La estimación de la matriz de varianzas de los término s espec íﬁcos es

diag(0.0 16, 0.006, 0.032 , 0.040, 0.201), y el modelo estimado para el factor es







0.70 0.00

0.00 0.55



1,t−1

2,t−1







si IOS

t−1

< −2.3







0.78 0.00

0.00 0.67



1,t−1

2,t−1







si IOS

t−1

≥ −2.3

donde cov



(1)



= diag(0.30, 0.08), cov



(2)



= diag(0.27 , 0.04 ) para

(1)



(1)

, a

(1)



′

y a

(2)



(2)

, a

(2)



′

6. Conclusiones

El modelo presentado en este trabajo permite analizar sistemas de series tem-

porales que presenten efectos no lineales del tipo threshold. El modelo puede inter-

pretarse o bien como una reparametriz ación del mo delo T AR vectorial, que reduce

signiﬁcativamente el número de parámetros, o bien como una extensión del modelo

de Peña y Box que permite tener en cuenta efectos no linea les. El vector de los

factores comunes se representa mediante diferentes proceso s autorregresivos que

se activan cuando determinada variable sobrepasa un valor umbral. Los diferen-

tes regímenes pueden relacionarse con los estados de una economía o con estado s

propios de la naturaleza, como e l caso que se estudia en la aplicación, donde lo s

estados están as ociados a la presencia o ausencia del fenómeno de El Niño.

Agradecimientos

Este artículo es producto del trabajo de tesis del primer autor (Cor real 2007)

para obtener el título de doctor en Estadística de la Universidad Nacional de

Colombia.



Recibido: marzo de 2008 — Aceptado: s eptiembre de 2008



Referencias

Correa l, M. E. (2007), Modelo factorial dinámico con efectos umbral, Tesis docto-

ral, Departamento de Estadística, Facultad de Ciencias, Universidad Nacional

de Colombia.

Forni, M., Hallin, M., Lippi, M. & Reichlin, L. (2 005), ‘The Generalized Dyna-

mic Facto r Model: One-Sided Estimation and Forec asting’, Journal of the

American Statistical Association 100, 8 30–840.

Revista Colombiana de Estadística 31 (2008) 183–192

192 María Elsa Correal & Daniel Peña

Gonzalo, J. & Pitarakis, J. Y. (2002), ‘Estimation and Model Selection Bas ed

Inference in Single and Multiple Threshold Models’, Journal of Econometrics

110, 319–352.

Hansen, B. E. (1997), ‘Inference in TAR Models’, St udies in Nonlinear Dynamics

and Econometrics 2 , 1–14.

Hansen, B. E. (2000), ‘Sample Splitting and Thresho ld Estimation’, Econometrica

68, 575–603.

Hu, Y. P. & Chou, R. J. (2004), ‘On the Peña-Box Model’, Journal of Time Series

Analysis 25, 811–830.

Peña, D. & Box, G. E. P. (1987), ‘Identifying a Simplifying Structure in Time

Series’, Journal of the American Statistical Association 82, 83 6–843.

Peña, D. & Poncela, P. (2004), ‘Forecasting w ith Nonstationary Dynamic Fac tor

Models’, Journal of Econometrics 119, 291–321.

Peña, D. & Poncela, P. (2006), ‘Nonstationary Dynamic Factor Models’, Journal

of Statistical Planning and Inference 136, 1237–1257.

Shumway, R. H. & Stoﬀer, D. S. (1982), ‘An Approach to Time Series Smoothing

and For e c asting Using the EM Algorithm’, Journal of Time Series Analysis

3, 253–264.

Sto ck, J. H. & Watson, M. W. (2002), ‘Forecasting Using Principal Components

From a Large Number of Predictors’, Journal of the American Statistical

Association 97, 116 7–1179.

Tong, H. & Lim, K. S. (1 980), ‘Threshold Autoregression, Limit Cycles and Cy-

clical Data’, Journal of The Royal Statistics Society Ser. B(4), 245 –292.

Tsay, R. S. (1989 ), ‘Outliers, Level Shifts and Variance Changes in Time Series’,

Journal of Forecasting 7, 1–20.

Tsay, R. S. (1998), ‘Testing and Modeling Multivariate Threshold Models’, Journal

of the American Statistical Association 93, 1188–1202.

Watson, M. W. & Engle, R. F. (1983), ‘Alternative Algorithms for the Estima-

tion of Dyna mic Fa c tor, Mimic and Varying Coe ﬃcient Regression Models’,

Journal of Econometrics 23, 385–400.

Wu, L. S., Pai, J. S. & Hosking, J. R. M. (1996), ‘An Algor ithm for Estimating

Parameters of State-Space Models’, Statistics & Probability Letters 28, 99–

106.

Revista Colombiana de Estadística 31 (2008) 183–192

Comparison between Two Dimensionality Reduction Methods in Time Series

Article

Full-text available

Dec 2009

Hanwen Zhang

Two methods of dimensionality reduction of multivariate stationary time series are analyzed: Peña-Box's methodology in the time domain and Bri-llinger's methodology in the frequency domain. Two failures of Peña-Box's methodology were found, and their corrections are given. Also the two me-thods are compared regarding to their capacities to identify the number of latent factors by simulations and an empirical application.

Comparación entre dos métodos de reducción de dimensionalidad en series de tiempo

Article

Full-text available

Dec 2009

Hanwen Zhang

En este trabajo se analizan dos métodos de reducción de dimensionalidad en series de tiempo multivariadas estacionarias: el método de Peña y Box, basado en el dominio del tiempo, y el método de Brillinger, basado en el dominio de las frecuencias. Se encontraron dos fallas en el método de Peña y Box, y se propusieron correcciones a estas. También se compararon los dos métodos con respecto a la capacidad para identificar el número de factores latentes mediante simulaciones y se realizó una aplicación empírica.

Determinantes de la Inflación en una Economía Dolarizada: El Caso Ecuatoriano

Article

En este documento se estima un modelo VAR estructural para iden-tificar las causas de la inflación en el Ecuador. La contribución de las variables exógenas en la inflación se analiza utilizando la descomposición de la varianza. A diferencia de estudios anteriores, no sólo se identi-fica el impacto de cada variable exógena en la tasa de inflación, sino que además se estima la tasa de inflación a partir de las variables exógenas del modelo. Los resultados muestran que en el primer trimestre del 2008 los principales determinantes de la inflación en el Ecuador fueron los precios internacionales, los tipos de cambio y las políticas públicas. por su excelente asistencia en esta investigación; y, Miguel Acosta y Kléver Mejía por sus comentarios a versiones pre-liminares de este documento. Al momento de participar en esta investigación, Wilson Pérez trabajaba en la Dirección de Investigaciones Económicas del Banco Central del Ecuador. Las opiniones, errores y omisiones son de responsabilidad exclusiva de los autores y no nece-sariamente reflejan la posición del Banco Central del Ecuador, ni de sus autoridades. Para cualquier comentario o sugerencia favor comunicarse con igachet@bce.ec, dmaldonado@bce.ec y/o wperez@usfq.edu.ec.

Determinants of Inflation in a Dollarized Economy: The Case of Ecuador

Article

Mar 2008

In this paper we estimate a structural VAR model to identify the causes of inflation in Ecuador. To examine the VAR dynamics, we use the decomposition of the variance because it provides information about the relative importance of each shock to the variables in the VAR. We differ from previous studies because we are able not only to identify the impact of each exogenous variable on the inflation rate but also to estimate the inflation rate from the exogenous variables in the model. We found that on the first quarter of 2008 the annual inflation rate in Ecuador was mainly caused by international prices, exchange rates and public policy.

Identifying a Simplifying Structure in Time Series

Article

Full-text available

Sep 1987

This article studies how to identify hidden factors in multivariate time series process. This problem is important because, when the series are driven by a set of common factors, (a) a large number of parameters may be needed to obtain an adequate representation of the system and (b) the estimated parameters will be highly correlated. Therefore, a complex and badly defined relationship can appear when, in fact, a simpler and parsimonious model in terms of a few common factors can be operating. This article develops a methodology to identify the number of factors and to build a simplifying transformation to represent the series. It is proved that the number of factors is equal to the rank of the covariance matrices and the parameter matrices of the infinite moving average representation of the process. The eigenvectors of these matrices will provide the canonical transformation. The method is illustrated with one example, using series of the price of wheat in five provinces of Spain in the 19th century. The standard approach to build a vector autore-gressive integrated moving average model showed a complex relationship with all kinds of feedback operating. When the methodology developed in the article was applied, however, two factors were identified and a clearer and simpler representation of the system was achieved.

Threshold autoregression, limit cycles and cyclical data- with discussion

Article

Full-text available

Jan 1980

Testing and Modeling Multivariate Threshold Models

Article

Sep 1998
J AM STAT ASSOC

R.S. Tsay

Threshold autoregressive models in which the process is piecewise linear in the threshold space have received much attention in recent years. In this article I use predictive residuals to construct a test statistic for detecting threshold nonlinearity in a vector time series and propose a procedure for building a multivariate threshold model. The thresholds and the model are selected jointly based on the Akaike information criterion. The finite-sample performance of the proposed test is studied by simulation. The modeling procedure is then used to study arbitrage in security markets and results in a threshold cointegration between logarithms of future contracts and spot prices of a security after adjusting for the cost of carrying the contracts. In this particular application, thresholds are determined in part by the transaction costs. I also apply the proposed procedure to U.S. monthly interest rates and two river flow series of Iceland.

Forecasting Using Principal Components From a Large Number of Predictors

Article

Dec 2002

This article considers forecasting a single time series when there are many predictors (N) and time series observations (T). When the data follow an approximate factor model, the predictors can be summarized by a small number of indexes, which we estimate using principal components. Feasible forecasts are shown to be asymptotically efficient in the sense that the difference between the feasible forecasts and the infeasible forecasts constructed using the actual values of the factors converges in probability to 0 as both N and T grow large. The estimated factors are shown to be consistent, even in the presence of time variation in the factor model.

An Approach to Time Series Smoothing and Forecasting Using the EM Algorithm

Article

Jul 1982
J TIME SER ANAL

. An approach to smoothing and forecasting for time series with missing observations is proposed. For an underlying state-space model, the EM algorithm is used in conjunction with the conventional Kalman smoothed estimators to derive a simple recursive procedure for estimating the parameters by maximum likelihood. An example is given which involves smoothing and forecasting an economic series using the maximum likelihood estimators for the parameters.

Outliers, Level Shifts, and Variance Changes in Time Series

Article

Jan 1988
J FORECASTING

Ruey S. Tsay

Outliers, level shifts, and variance changes are commonplace in applied time series analysis. However, their existence is often ignored and their impact is overlooked, for the lack of simple and useful methods to detect and handle those extraordinary events. The problem of detecting outliers, level shifts, and variance changes in a univariate time series is considered. The methods employed are extremely simple yet useful. Only the least squares techniques and residual variance ratios are used. The effectiveness of these simple methods is demonstrated by analysing three real data sets.

Inference in TAR models

Article

Feb 2007
STUD NONLINEAR DYN E

Bruce E. Hansen

A distribution theory is developed for least-squares estimates of the threshold in Threshold Autoregressive (TAR) models. We find that if we let the threshold effect (the difference in slopes between the two regimes) become small as the sample size increases, then the asymptotic distribution of the threshold estimator is free of nuisance parameters (up to scale). Similarly, the likelihood ratio statistic for testing hypotheses concerning the unknown threshold is asymptotically free of nuisance parameters. These asymptotic distributions are nonstandard, but are available in closed form, so critical values are readily available. To illustrate this theory, we report an application to the U.S. unemployment rate. We find statistically significant threshold effects.

Forecasting with nonstationary dynamic factor models

Article

Apr 2004
J ECONOMETRICS

In this paper we analyze the structure and the forecasting performance of the dynamic factor model. It is shown that the forecasts obtained by the factor model imply shrinkage pooling terms, similar to the ones obtained from hierarchical Bayesian models that have been applied successfully in the econometric literature. Thus, the results obtained in this paper provide an additional justification for these and other types of pooling procedures. The expected decrease in MSE for using a factor model versus univariate ARIMA and shrinkage models are studied for the one factor model. Monte Carlo simulations are presented to illustrate this result. A factor model is also built to forecast GNP of European countries and it is shown that the factor model can provide a substantial improvement in forecasts with respect to both univariate and shrinkage univariate forecasts.

Estimation and model selection based inference in single and multiple threshold models

Article

Oct 2002
J ECONOMETRICS

This paper evaluates the properties of a joint and sequential estimation procedure for estimating the parameters of single and multiple threshold models. We initially proceed under the assumption that the number of regimes is known á priori but subsequently relax this assumption via the introduction of a model selection based procedure that allows the estimation of both the unknown parameters and their number to be performed jointly. Theoretical properties of the resulting estimators are derived and their finite sample properties investigated.

An algorithm for estimating parameters of state-space models

Article

Feb 1996
STAT PROBABIL LETT

We describe an algorithm for estimating the parameters of time-series models expressed in state-space form. The algorithm is based on the EM algorithm, and generalizes an algorithm given by Shumway and Stoffer (1982)

Modelo factorial dinámico threshold

Abstract

Recommended publications

Factores relacionados con la intención emprendedora de universitarios en agroindustrias en Puebla, M...

Estimación de la entalpía de gelatinización en una mezcla de almidón termoplástico

Preguntas cognitivas y metacognitivas en el aprendizaje y la generación de estrategias de resolución...

Factores que influyen en la intención de uso de las tarjetas de crédito por parte de los jóvenes uni...