Available via license: CC BY
Content may be subject to copyright.
Revista Colombiana de Estadística
Diciembre 2008, volumen 31, no. 2, pp. 183 a 192
Modelo factorial dinámico threshold
Threshold Dynamic Factor Model
María Elsa Correal
1,a
, Daniel Peña
2,b
1
Departamento de Ingeniería Industrial, Universidad de los Andes, Bogotá,
Colombia
2
Departamento de Estadística y Economía, Universidad Carlos III de Madrid,
Madrid, España
Resumen
En este artículo se introduce el modelo factorial dinámico threshold, el
cual permite analizar sistemas de series temporales que presenten comporta-
mientos no lineales del tipo umbral. Se propone un método de estimación que
combina el algoritmo EM con un procedimiento de búsqueda directa utili-
zando los algoritmos del filtro y de suavización de Kalman. El procedimiento
estima factores comunes con comportamientos que cambian de régimen de
acuerdo con una variable umbral.
Palabras clave: series de tiempo no lineales, análisis factorial, modelo thresh-
old, algoritmo EM , filtro de Kalman.
Abstract
This paper introduces a threshold dynamic factor model for the analysis
of vector time series which shows non-linear behavior of threshold type. We
propose an estimation procedure combining an EM algorithm with a grid
search procedure by the ways of the Kalman filter and smoothing recursions.
We estimate common latent threshold factors that may explain the dynamic
relationships within the group of variables.
Key words: Nonlinear time series, Factor analysis, Threshold model, EM
algorithm, Kalman filter.
1. Introducción
En este artículo se presenta un procedimiento para estimar factores comunes
en series temporales que presenten comportamientos no lineales del tipo threshold.
a
Profesora asociada. E-mail: mcorreal@uniandes.edu.co
b
Profesor catedrático. E- mail: dpena@est-econ.uc3m.es
183
184 María Elsa Correal & Daniel Peña
Tanto los procesos multivariados como la no linealidad c omprenden desarrollos
meto dológicos de especial interés dentro del estudio de series de tiempo. Uno de los
modelos no lineales para series de tiempo más difundido es el modelo autorreg resivo
umbral, T AR (Threshold AutoRegressive), propuesto inicialmente por Tong & Lim
(1980). Este modelo está representado mediante diferentes procesos autorregresivos
que se activan cuando determinada variable sobrepasa un valor umbral. El análisis
de los modelos T AR en el caso multivariado es más reciente. Tsay (19 98) es tal
vez el primero e n proponer un procedimiento de estimación y una prueba de no
linealidad para el caso vectorial. La inferencia estadística en los modelos thresh-
old ha sido estudiada entre otros por Hansen (1997, 2000), Gonzalo & Pitarakis
(2002) y, para el caso multivariado, por Tsay (19 98). Al igual que en los modelos
vectoriales V ARM A (Vector AutoRegressive-MovingAverage), en los modelos T AR
multivariados existen múltiples estructuras con características similares y no existe
una solución simple para la identificación de los parámetros. La proliferación de
parámetros puede ser tan alta como para hacer la estimación intratable en la
práctica. Un modelo factor ial no solamente reduce la dimensión del sistema, sino
que permite dejar al des cubierto componentes comunes a l conjunto de variables
que explican las interrelaciones existentes entre e llas. El modelo factorial dinámico
de Peña & Box (1987) representa las var iables obse rvadas mediante una suma de
dos componentes latentes ortogonales: una común a todas las variables, descrita
por un proceso ARMA (AutoRegressive-MovingAverage) de dimensión reducida;
y o tra específica a cada variable particular, que no está correlacionada con la
componente común. Este modelo inicialmente formulado para series estacionarias
ha sido generalizado a series no estacionarias en Peña & Poncela (2004, 2006);
recientemente se han pr e sentado técnicas para su identificación en Hu & Chou
(2004). Este modelo debe distinguirse del modelo factorial dinámico utilizado por
Sto ck & Watson (2002) y Forni et al. (2005), en el cual se asume que el número
de variables o la dimensión del sistema tiende a infinito. La presencia o ausencia
de este supuesto es determinante en los pro c esos de identificación y estimación.
En el modelo factorial que se define en este trabajo no se hace este supuesto. El
objetivo de este trabajo es extender el modelo factorial dinámico de Peña y Box
para permitir tener en cuenta efectos no lineales del tipo umbral.
El modelo factorial dinámico threshold se define en la segunda sección del do-
cumento y sus propiedades se analizan en la tercera. En la cuarta se presenta el
méto do de estimació n. La estrategia consiste en realizar la es timac ión secuencial-
mente por co nce ntración de la función de verosimilitud, combinando el algoritmo
EM (Expectation-Maximization) con un método de búsqueda directa. En la quinta
sección, la metodología se aplica a un sistema de caudales de ríos colombianos en el
cual hay dos regímenes que se activa n mediante la variable del Índice de Oscilación
del Sur.
2. Formulación del modelo
Definición 1. Sea Z
t
una serie temporal k- dimensional, Z
t
= (z
1t
, z
2t
, . . . , z
kt
)
′
con media cero. Diremos que Z
t
se representa mediante un modelo factorial di-
námico threshold con c r e gímenes de órdenes p
1
, p
2
, . . . , p
c
y variable umbral w
t
,
Revista Colombiana de Estadística 31 (2008) 183–192
Modelo factorial dinámico threshold 185
si
Z
t
= Λf
t
+ u
t
;
f
t
=
p
j
P
i=1
φ
(j)
i
f
t−i
+ Υ
(j)
a
t
, si w
t−d
∈ (γ
j−1
, γ
j
], j = 1, . . . , c.
(1)
donde w
t
es una va riable aleatoria unidimensional observable y e stacionaria, f
t
es un vector aleatorio r-dimensional no observable con media ce ro, u
t
es ruido
blanco k-dimensional con matriz de varianza-covarianza Σ
u
diagonal y definida
positiva, a
t
es un ruido blanco r-dimensional con matriz de varianza-covarianza la
identidad I
r
y tales que u
t
sea independiente de f
t−h
para h ≥ 0, a
t
independiente
de f
t−h
para h ≥ 1, { w
t
}, {u
t
} y {a
t
} independientes entre sí. Los parámetros del
modelo son los denominados parámetros umbral: −∞ = γ
0
< γ
1
< · · · < γ
c−1
<
γ
c
= −∞, el entero positivo d, rezago de la va riable umbral, la matriz de carga
Λ, de dimensión (k × r) que debe s er tal que rango(Λ) = r y Λ
′
Λ = I
r
, I
r
matriz
identidad de or den r, y los parámetros que determinan la dinámica del factor,
φ
(j)
i
, Υ
(j)
j = 1, . . . , c, matrices de dimensión (r × r), con Υ
(j)
diagonal y definida
positiva.
El modelo propuesto detecta componentes comunes no lineales que puedan ser
representadas por modelos umbral y q ue involucren la dinámica propia del sistema.
La idea general es represe ntar el vector temp oral mediante la suma de dos com-
ponentes la tentes ortogonales: una común a las componentes del vector, descrita
por un proceso vectorial autorregre sivo threshold T AR, de dimensió n menor, y
otra específica a cada componente particular. La variable umbral w puede ser una
de las componentes estacionaria s del vector observado, z
jt
, j ≤ k, o una variable
exógena estacionaria que a fecte el estado del sistema, o una combinación de las
componentes de Z
t
. Esta combinación debe ser estaciona ria.
Mediante este modelo pueden salir a relucir características significativas en un
régimen y no en el otro. El proceso formulado para los factores permite tener en
consideración autorregresiones con órdenes diferentes en los regímenes. La serie de
los factores es generada por procesos diferentes en diferentes instantes de tiempo;
su cambio es consecuencia de un estado del sistema que se mantiene hasta que
determinada variable s obrepasa un valor umbral.
3. Propiedades del modelo
3.1. Identificación
El modelo propuesto hereda los problemas de identificación presentes en el
modelo factorial estático debido a la no obse rvabilidad de f . La imp osición de una
estructura T AR con c regímenes para los factor e s no evita la no identificación de
los parámetros. Efectivamente, si f
t
es un T AR r-dimensio nal con c regímenes de
órdenes p
1
, . . . , p
c
y variable umbral w
t
, entonces para cualquier matriz (r × r)
no singular C, el vector f
∗
t
= Cf
t
será también un T AR r-dimensional para la
misma varia ble umbral, el mismo número de regímenes c y los mismos órdenes
Revista Colombiana de Estadística 31 (2008) 183–192
186 María Elsa Correal & Daniel Peña
autorregresivos dentro de cada régimen. Específicamente, f
∗
t
se expresa como
f
∗
t
=
p
j
X
i=1
φ
∗(j)
i
f
∗
t−i
+ Υ
∗(j)
a
t
, si w
t−d
∈ (γ
j−1
, γ
j
], j = 1, . . . , c
donde φ
∗(j)
i
= Cφ
(j)
i
C
−1
y Υ
∗(j)
= CΥ
(j)
. Dicho de otra forma, para cualquier
matriz C no singular, los conjuntos
n
Λ, φ
(1)
1
, . . . , φ
(c)
p
c
, Υ
(1)
, . . . , Υ
(c)
, Σ
u
, d, γ
1
, . . . , γ
c
o
y
n
ΛC
−1
, Cφ
(1)
1
C
−1
, . . . , Cφ
(c)
p
c
C
−1
, CΥ
(1)
, . . . , CΥ
(c)
, Σ
u
, d, γ
1
, . . . , γ
c
o
no pueden distinguirse a partir de las observaciones.
Proposición 1. Las restricciones Λ
′
Λ = I
r
y Υ
(j)
matriz diagonal y positiva
definida para j = 1, . . . , c, eliminan esta fuente de indeterminación.
Demostración . En efecto, si Λ y Λ
∗
= ΛC
−1
satisfacen la primera restric-
ción, Λ
′
Λ = I
r
y (Λ
∗
)
′
Λ
∗
= (C
−1
)
′
C
−1
= I
r
, entonces C será matriz ortogo-
nal. Además, si Υ
(j)
y Υ
∗(j)
= CΥ
(j)
satisfacen la se gunda restricción, entonces
C = Υ
∗(j)
(Υ
(j)
)
−1
y, por tanto, C es diagonal. Puesto que la única matriz orto go-
nal y diagonal es la matriz identidad, se concluye que C = I
r
.
Vale la p e na mencionar que la representación T AR de los factores en el mo delo
factorial dinámico threshold (1) puede escribirse como f
t
=
p
j
P
i=1
φ
(j)
i
f
t−i
+ a
(j)
t
con
a
(j)
t
= Υ
(j)
a
t
. Puede verse entonces que la matriz de varia nza covarianza de a
t
puede restring irse a la identidad sin pérdida de generalidad.
3.2. Estructura para las matrices de covarianza rezagadas
Las matric e s de covarianza para diferentes rezagos contienen informac ión acerca
de la dinámica de la s interrelaciones entre las diferentes co mpo nentes del proceso.
Sean Γ
Z
(h) = E(Z
t−h
Z
′
t
), Γ
f
(h) = E(f
t−h
f
′
t
) y Σ
u
(h) = E(u
t−h
u
′
t
) para h =
0, 1, 2, . . . las matrices de covarianza rezaga das de Z, f y u respec tiva mente.
Proposición 2. Si Z
t
se representa mediante un modelo autorregresivo threshold,
rango(Γ
Z
(h)) = r, pa ra h = 1, 2, . . .
Demostración . En efecto, si f
t
es estacionario de segundo orden, Z
t
también lo
es, y puesto que Z
t
= Λf
t
+ u
t
, y u
t
es ruido blanco,
Γ
Z
(h) = ΛΓ
f
(h)Λ
′
, para h = 1, 2 , . . .
Esta propiedad es muy útil en la etapa de identificación del número de factores
comunes.
Revista Colombiana de Estadística 31 (2008) 183–192
Modelo factorial dinámico threshold 187
3.3. Modelo de rezagos distribuidos por regímenes
Proposición 3. Z
t
puede ex presarse como un modelo de rezagos distribuidos por
regímenes
Z
t
=
p
j
X
i=1
Λ
(j)
i
f
t−i
+ ε
(j)
t
, si w
t−d
∈ (γ
j−1
, γ
j
], j = 1, . . . , c
donde los espacios nulos de Λ
(j)
i
comparten un subespacio común de dimensión
(k − r).
Demostración . En efecto, remplazando la segunda ecuación de (1) en la pri-
mera se obtiene Λ
(j)
i
= Λφ
(j)
i
; por tanto, si M es una matriz k × (k − r) cu-
yas columnas generan el espacio nulo de Λ
′
, M
′
Λ
(j)
i
= 0 para i = 1, . . . , p
j
,
j = 1, . . . , c. Sin embargo, las matrices Λ
(j)
i
no necesariamente tienen rango com-
pleto y rango
Λ
(j)
i
= rango
φ
(j)
i
.
El ruido asociado al modelo expresado en rezagos distribuidos es ε
(j)
t
=
ΛΥ
(j)
a
t
+ u
t
, y su matriz de covarianza, no necesariamente diagonal, viene dada
por
Ψ
(j)
ε
= ΛD
(j)
Λ
′
+ Ψ
u
, j = 1, . . . , c
con D
(j)
= Υ
(j)
Υ
(j)
matriz diagona l.
4. Estimación
Se propone estimar los parámetro s del modelo por máxima verosimilitud me-
diante un algoritmo que combina el principio del algoritmo EM con un método de
búsqueda directa. El procedimiento maximiza el logaritmo de la función de verosi-
militud L
w
Z
de forma secuencial, primero sobre ψ
1
=
Λ, Φ
(1)
, Φ
(2)
, Υ
(1)
, Υ
(2)
, Σ
u
y luego sobre ψ
2
= {d, γ}. Para d y γ fijos, el máximo sobre ψ
1
se obtiene mediante
un algoritmo EM . La utilización del algoritmo EM en el contexto de factores diná-
micos fue pro puesta inicialmente por Shumway & Stoffer (1982) y Watso n & Engle
(1983) y ha sido utilizada poster iormente por Wu et al. (19 96) y Peña & Poncela
(2006), entre otros. En la segunda eta pa, por búsqueda directa se encuentran los
valores
b
d y bγ que maximicen L
w
Z
. La búsqueda se re aliza para d ∈ {1 , . . . ,
¯
d},
¯
d una
cota para el retardo y γ ∈ {γ
1
, . . . , γ
L
}, conjunto formado por los cuantiles mues-
trales de la variable umbral escogidos de forma tal que en cada régimen se tengan
suficientes observaciones para estimar adecuadamente los parámetros asociados.
Siendo así las cosas, se tendrán que realizar
¯
d L veces el procedimiento EM .
Revista Colombiana de Estadística 31 (2008) 183–192
188 María Elsa Correal & Daniel Peña
Para d y γ fijos, el logaritmo de la función de verosimilitud de los datos com-
pletos, L
w
Z,f
(ψ
1
; ψ
2
), puede separarse por una función indicadora:
L
w
Z,f
(ψ
1
; ψ
2
) = cte −
T
2
log |Σ
u
| −
1
2
T
X
t=1
(Z
t
− Λf
t
)
′
Σ
−1
u
(Z
t
− Λf
t
)
−
1
2
X
t∈I
1
log
Υ
(1)
Υ
(1)
−
1
2
X
t∈I
2
log
Υ
(2)
Υ
(2)
−
1
2
X
t∈I
1
(d,γ)
f
t+1
− ϕ
(1)
X
t
′
Υ
(1)
Υ
(1)
−1
f
t+1
− ϕ
(1)
X
t
−
1
2
X
t∈I
2
(d,γ)
f
t+1
− ϕ
(2)
X
t
′
Υ
(2)
Υ
(2)
−1
f
t+1
− ϕ
(2)
X
t
donde I
1
(d, γ) =
t ∈ {1, . . . , T }/w
t−d
< γ
, I
2
(d, γ) =
t ∈ {1, . . . , T }/w
t−d
≥
γ
, X
t
= (f
′
t
, f
′
t−1
, . . . , f
′
t−p+1
)
′
vector rp × 1, y ϕ
(i)
=
h
φ
(i)
1
φ
(i)
2
· · ·
φ
(i)
p
i
matriz
r × rp, para i = 1, 2.
Utilizando la solución de la k- é sima iteración,
e
ψ
(k)
1
, la evalua c ión del paso E
del algoritmo
Q
ψ
1
;
e
ψ
(k)
1
= E
e
ψ
(k)
1
L
W
Z,f
(ψ
1
; ψ
2
)
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
(2)
se obtiene involucrando los algoritmos del filtro de Kalman y de suavización de
intervalo fijo aplicados a una representación espacio-estado del modelo. Como r e -
sultado de este paso, se obtienen las sucesiones
b
X
(k)
t|T
, P
(k)
t|T
, M
(k)
t|T
, t = 1, . . . , T ,
donde
b
X
(k)
t|T
= E
e
ψ
(k)
1
X
t
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
P
(k)
t|T
= E
e
ψ
(k)
1
h
X
t
−
b
X
t|T
X
t
−
b
X
t|T
′
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
i
M
(k)
t|T
= E
e
ψ
(k)
1
h
X
t+1
−
b
X
t+1|T
X
t
−
b
X
t|T
′
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
i
Teniendo en cuenta que f
t
= S
′
t
X
t
para S
′
=
I
r
| 0
r
| · · · | 0
r
, también se
obtienen las sucesiones
b
f
(k)
t|T
= E
e
ψ
(k)
1
f
t
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
= S
′
b
X
(k)
t|T
E
e
ψ
(k)
1
f
t
f
′
t
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
= S
′
P
(k)
t|T
+
b
X
(k)
t|T
b
X
(k)′
t|T
S
E
e
ψ
(k)
1
f
t+1
X
′
t
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
= S
′
M
(k)
t|T
+
b
X
(k)
t|T
b
X
(k)′
t|T
Revista Colombiana de Estadística 31 (2008) 183–192
Modelo factorial dinámico threshold 189
En la k-ésima iteración del paso M del algoritmo s e maximiza Q
ψ
1
;
e
ψ
(k)
1
con
respecto a ψ
1
. Se mostrará a continuación que la solución viene dada por
e
Λ
(k+1)
=
T
X
t=1
Z
t
b
f
(k)′
t|T
!
T
X
t=1
b
f
(k)
t|T
b
f
(k)′
t|T
+ P
(k)
!
−1
e
Σ
(k+1)
v
=
1
T
T
X
t=1
Z
t
−
e
Λ
(k+1)
b
f
(k)
t|T
Z
t
−
e
Λ
(k+1)
b
f
(k)
t|T
′
+
e
Λ
(k+1)
P
(k)
e
Λ
′
(k+1)
!
eϕ
(j)
(k+1)
=
X
t∈I
j
b
f
(k)
t+1|T
b
X
(k)′
t
+ V
(k)
j
!
X
t∈I
j
b
f
(k)
t+1|T
b
f
(k)′
t+1|T
+ W
(k)
j
!
−1
, j = 1, 2
e
Υ
(j)
(k+1)
=
1
T
j
X
t∈I
j
b
f
(k)
t+1|T
− eϕ
(j)
(k+1)
b
X
(k)
t
′
b
f
(k)
t+1|T
− eϕ
(j)
(k+1)
b
X
(k)
t
+ eϕ
(j)
(k+1)
W
(k)
j
eϕ
(j)
(k+1)
!
donde T
j
número de casos en el régimen j y las matrices P
(k)
, V
(k)
j
y W
(k)
j
están
dadas por
P
(k)
=
T
X
t=1
S
′
P
(k)
t|T
S, V
(k)
j
=
X
t∈I
j
S
′
M
(k)
t|T
, W
(k)
j
=
X
t∈I
j
S
′
P
(k)
t|T
S
para S
′
=
I
r
| 0
r
| · · · | 0
r
.
En efecto, el término que involucra a Λ en (2) es
E
T
X
t=1
Z
t
− Λf
t
′
Σ
−1
u
Z
t
− Λf
t
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
!
que es igual a
traza
Σ
−1
u
T
X
t=1
Z
t
Z
′
t
− Λ
b
f
(k)
t|T
Z
′
t
− Z
t
b
f
(k)′
t|T
Λ
′
+ Λ
b
f
(k)
t|T
b
f
(k)′
t|T
+ S
′
P
(k)
t|T
S
Λ
′
!
y, por tanto,
∂Q
∂Λ
= −Σ
−1
u
T
X
t=1
Z
t
b
f
(k)′
t|T
+ Σ
−1
u
Λ
T
X
t=1
b
f
(k)
t|T
b
f
(k)′
t|T
+ S
′
P
(k)
t|T
S
Igualando a ce ro este sistema de derivadas parciales, se obtiene el resultado
para
e
Λ
(k+1)
.
Ahora, fijando
e
Λ
(k+1)
, la parte de E
L
W
Z,f
(ψ
1
; ψ
2
)
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
que
involucra a Σ
u
puede escribirse como
T
2
log |Σ
u
| −
1
2
×
traza
"
Σ
−1
u
T
X
t=1
Z
t
−
e
Λ
(k+1)
b
f
(k)
t|T
Z
t
−
e
Λ
(k+1)
b
f
(k)
t|T
′
+
e
Λ
(k+1)
S
′
P
(k)
t|T
S
e
Λ
(k+1)
#
Revista Colombiana de Estadística 31 (2008) 183–192
190 María Elsa Correal & Daniel Peña
y entonces va le el resultado para
e
Σ
(k+1)
u
.
El resultado para eϕ
(j)
(k+1)
y
e
Υ
(j)
(k+1)
se prueba de forma similar. En este caso, apa-
rece E(f
t+1
X
t
), que involucra a V
(k)
= S
′
M
(k)
t|T
. Más detalles pueden consultarse
en Correal (2007).
El algoritmo proporcio na también el e stimador óptimo de los factores:
b
f
t|T
= E
f
t
| Z
1
, . . . , Z
T
, w
1
, . . . , w
T
5. Aplicación
El modelo y el método de estimación se aplican a un vector de dimensión 5 con-
formado po r los caudales de lo s ríos colombianos Calima, Cauca, Grande, Ovejas y
Prado, que pertenecen a la cuenca del Magdalena. Los datos históricos disponibles
abarcan un pe riodo de 36 años y corresponden al per iodo compre ndido entre enero
de 1955 y diciembre de 19 90, para un total de 432 observaciones mensuales.
El procedimiento se realizó en tres etapas resumidas a continuación. Los re-
sultados detallados pueden consultarse en Correal (2007). En la primera se probó
la hipótesis de que los caudales pres e ntan un comportamiento no lineal del tipo
threshold con variable umbral Índice de Oscilación del Sur, IOS, variable atmos-
férica relacionada con el evento climático del fenómeno de El Niño. La hipótesis se
contrastó mediante el test propuesto por Tsay (1989). Este se basa en autorregre-
siones reordenadas de acuerdo con la variable umbral w
t−d
. El test se aplicó para
los r e tardos d = 1, 2, . . . , 12 y pa ra los datos z
it
= (1 − θB
12
)
−1
(1 − B
12
) log c
it
,
i = 1, . . . , 5; c
it
caudal del i−ésimo río en el instante t. De los nueve río s conside-
rados originalmente, los cinco utilizados en esta aplicación dieron significativos.
En la segunda etapa, se procedió a identificar el número de factores comunes.
Para esto se realizaron dos pruebas, ambas basadas en los vectores propios de
las matrices de autocovar ianza rezagadas observadas Γ
Z
(k) = E(Z
t−k
Z
′
t
), y cu-
yos detalles pueden cons ulta rse en Peña & Poncela (2006) y Hu & Chou (2004).
Los resultados de estas pr uebas llevaron a plantear un modelo con dos factores
comunes.
En la tercera etapa se implementó el algoritmo para estimar los parámetros del
modelo. El algoritmo de búsqueda se realizó sobre el par de conjuntos {1, 2, . . . , 12}
para d y {−2.6, −2.5, . . . , 2.3} para γ, con lo que el algoritmo EM se corrió 60
veces.
El estimador del valor umbral fue bγ = −2.3. Puesto que los episodio s del
fenómeno de El Niño se presentan acompañados de valores nega tivos del Índice de
Oscilación al Sur, el régimen 1 puede asociars e a una de las fases del fenómeno.
El resultado para el rezago fue
b
d = 1 y la estimación para la matriz de carga del
modelo factorial dinámico threshold es
b
Λ =
0.29 0.54 0.34 0.47 0.52
0.94 −0.05 −0.06 −0.23 −0.22
′
Revista Colombiana de Estadística 31 (2008) 183–192
Modelo factorial dinámico threshold 191
La estimación de la matriz de varianzas de los término s espec íficos es
b
Σ
u
=
diag(0.0 16, 0.006, 0.032 , 0.040, 0.201), y el modelo estimado para el factor es
f
1t
f
2t
=
0.70 0.00
0.00 0.55
f
1,t−1
f
2,t−1
+
a
1t
a
2t
si IOS
t−1
< −2.3
f
1t
f
2t
=
0.78 0.00
0.00 0.67
f
1,t−1
f
2,t−1
+
a
1t
a
2t
si IOS
t−1
≥ −2.3
donde cov
a
(1)
t
= diag(0.30, 0.08), cov
a
(2)
t
= diag(0.27 , 0.04 ) para
a
(1)
t
=
a
(1)
1t
, a
(1)
2t
′
y a
(2)
t
=
a
(2)
1t
, a
(2)
2t
′
.
6. Conclusiones
El modelo presentado en este trabajo permite analizar sistemas de series tem-
porales que presenten efectos no lineales del tipo threshold. El modelo puede inter-
pretarse o bien como una reparametriz ación del mo delo T AR vectorial, que reduce
significativamente el número de parámetros, o bien como una extensión del modelo
de Peña y Box que permite tener en cuenta efectos no linea les. El vector de los
factores comunes se representa mediante diferentes proceso s autorregresivos que
se activan cuando determinada variable sobrepasa un valor umbral. Los diferen-
tes regímenes pueden relacionarse con los estados de una economía o con estado s
propios de la naturaleza, como e l caso que se estudia en la aplicación, donde lo s
estados están as ociados a la presencia o ausencia del fenómeno de El Niño.
Agradecimientos
Este artículo es producto del trabajo de tesis del primer autor (Cor real 2007)
para obtener el título de doctor en Estadística de la Universidad Nacional de
Colombia.
Recibido: marzo de 2008 — Aceptado: s eptiembre de 2008
Referencias
Correa l, M. E. (2007), Modelo factorial dinámico con efectos umbral, Tesis docto-
ral, Departamento de Estadística, Facultad de Ciencias, Universidad Nacional
de Colombia.
Forni, M., Hallin, M., Lippi, M. & Reichlin, L. (2 005), ‘The Generalized Dyna-
mic Facto r Model: One-Sided Estimation and Forec asting’, Journal of the
American Statistical Association 100, 8 30–840.
Revista Colombiana de Estadística 31 (2008) 183–192
192 María Elsa Correal & Daniel Peña
Gonzalo, J. & Pitarakis, J. Y. (2002), ‘Estimation and Model Selection Bas ed
Inference in Single and Multiple Threshold Models’, Journal of Econometrics
110, 319–352.
Hansen, B. E. (1997), ‘Inference in TAR Models’, St udies in Nonlinear Dynamics
and Econometrics 2 , 1–14.
Hansen, B. E. (2000), ‘Sample Splitting and Thresho ld Estimation’, Econometrica
68, 575–603.
Hu, Y. P. & Chou, R. J. (2004), ‘On the Peña-Box Model’, Journal of Time Series
Analysis 25, 811–830.
Peña, D. & Box, G. E. P. (1987), ‘Identifying a Simplifying Structure in Time
Series’, Journal of the American Statistical Association 82, 83 6–843.
Peña, D. & Poncela, P. (2004), ‘Forecasting w ith Nonstationary Dynamic Fac tor
Models’, Journal of Econometrics 119, 291–321.
Peña, D. & Poncela, P. (2006), ‘Nonstationary Dynamic Factor Models’, Journal
of Statistical Planning and Inference 136, 1237–1257.
Shumway, R. H. & Stoffer, D. S. (1982), ‘An Approach to Time Series Smoothing
and For e c asting Using the EM Algorithm’, Journal of Time Series Analysis
3, 253–264.
Sto ck, J. H. & Watson, M. W. (2002), ‘Forecasting Using Principal Components
From a Large Number of Predictors’, Journal of the American Statistical
Association 97, 116 7–1179.
Tong, H. & Lim, K. S. (1 980), ‘Threshold Autoregression, Limit Cycles and Cy-
clical Data’, Journal of The Royal Statistics Society Ser. B(4), 245 –292.
Tsay, R. S. (1989 ), ‘Outliers, Level Shifts and Variance Changes in Time Series’,
Journal of Forecasting 7, 1–20.
Tsay, R. S. (1998), ‘Testing and Modeling Multivariate Threshold Models’, Journal
of the American Statistical Association 93, 1188–1202.
Watson, M. W. & Engle, R. F. (1983), ‘Alternative Algorithms for the Estima-
tion of Dyna mic Fa c tor, Mimic and Varying Coe fficient Regression Models’,
Journal of Econometrics 23, 385–400.
Wu, L. S., Pai, J. S. & Hosking, J. R. M. (1996), ‘An Algor ithm for Estimating
Parameters of State-Space Models’, Statistics & Probability Letters 28, 99–
106.
Revista Colombiana de Estadística 31 (2008) 183–192