ArticlePDF Available

Modelo factorial dinámico threshold

Authors:

Abstract

En este artículo se introduce el modelo factorial dinámico threshold, el cual permite analizar sistemas de series temporales que presenten comportamientos no lineales del tipo umbral. Se propone un método de estimación que combina el algoritmo EM con un procedimiento de búsqueda directa utilizando los algoritmos del filtro y de suavización de Kalman. El procedimiento estima factores comunes con comportamientos que cambian de régimen de acuerdo con una variable umbral.
Revista Colombiana de Estadística
Diciembre 2008, volumen 31, no. 2, pp. 183 a 192
Modelo factorial dinámico threshold
Threshold Dynamic Factor Model
María Elsa Correal
1,a
, Daniel Peña
2,b
1
Departamento de Ingeniería Industrial, Universidad de los Andes, Bogotá,
Colombia
2
Departamento de Estadística y Economía, Universidad Carlos III de Madrid,
Madrid, España
Resumen
En este artículo se introduce el modelo factorial dinámico threshold, el
cual permite analizar sistemas de series temporales que presenten comporta-
mientos no lineales del tipo umbral. Se propone un método de estimación que
combina el algoritmo EM con un procedimiento de búsqueda directa utili-
zando los algoritmos del filtro y de suavización de Kalman. El procedimiento
estima factores comunes con comportamientos que cambian de régimen de
acuerdo con una variable umbral.
Palabras clave: series de tiempo no lineales, análisis factorial, modelo thresh-
old, algoritmo EM , filtro de Kalman.
Abstract
This paper introduces a threshold dynamic factor model for the analysis
of vector time series which shows non-linear behavior of threshold type. We
propose an estimation procedure combining an EM algorithm with a grid
search procedure by the ways of the Kalman filter and smoothing recursions.
We estimate common latent threshold factors that may explain the dynamic
relationships within the group of variables.
Key words: Nonlinear time series, Factor analysis, Threshold model, EM
algorithm, Kalman filter.
1. Introducción
En este artículo se presenta un procedimiento para estimar factores comunes
en series temporales que presenten comportamientos no lineales del tipo threshold.
a
Profesora asociada. E-mail: mcorreal@uniandes.edu.co
b
Profesor catedrático. E- mail: dpena@est-econ.uc3m.es
183
184 María Elsa Correal & Daniel Peña
Tanto los procesos multivariados como la no linealidad c omprenden desarrollos
meto dológicos de especial interés dentro del estudio de series de tiempo. Uno de los
modelos no lineales para series de tiempo más difundido es el modelo autorreg resivo
umbral, T AR (Threshold AutoRegressive), propuesto inicialmente por Tong & Lim
(1980). Este modelo está representado mediante diferentes procesos autorregresivos
que se activan cuando determinada variable sobrepasa un valor umbral. El análisis
de los modelos T AR en el caso multivariado es más reciente. Tsay (19 98) es tal
vez el primero e n proponer un procedimiento de estimación y una prueba de no
linealidad para el caso vectorial. La inferencia estadística en los modelos thresh-
old ha sido estudiada entre otros por Hansen (1997, 2000), Gonzalo & Pitarakis
(2002) y, para el caso multivariado, por Tsay (19 98). Al igual que en los modelos
vectoriales V ARM A (Vector AutoRegressive-MovingAverage), en los modelos T AR
multivariados existen ltiples estructuras con características similares y no existe
una solución simple para la identificación de los parámetros. La proliferación de
parámetros puede ser tan alta como para hacer la estimación intratable en la
práctica. Un modelo factor ial no solamente reduce la dimensión del sistema, sino
que permite dejar al des cubierto componentes comunes a l conjunto de variables
que explican las interrelaciones existentes entre e llas. El modelo factorial dinámico
de Peña & Box (1987) representa las var iables obse rvadas mediante una suma de
dos componentes latentes ortogonales: una común a todas las variables, descrita
por un proceso ARMA (AutoRegressive-MovingAverage) de dimensión reducida;
y o tra específica a cada variable particular, que no está correlacionada con la
componente común. Este modelo inicialmente formulado para series estacionarias
ha sido generalizado a series no estacionarias en Peña & Poncela (2004, 2006);
recientemente se han pr e sentado técnicas para su identificación en Hu & Chou
(2004). Este modelo debe distinguirse del modelo factorial dinámico utilizado por
Sto ck & Watson (2002) y Forni et al. (2005), en el cual se asume que el número
de variables o la dimensión del sistema tiende a infinito. La presencia o ausencia
de este supuesto es determinante en los pro c esos de identificación y estimación.
En el modelo factorial que se define en este trabajo no se hace este supuesto. El
objetivo de este trabajo es extender el modelo factorial dinámico de Peña y Box
para permitir tener en cuenta efectos no lineales del tipo umbral.
El modelo factorial dinámico threshold se define en la segunda sección del do-
cumento y sus propiedades se analizan en la tercera. En la cuarta se presenta el
méto do de estimació n. La estrategia consiste en realizar la es timac ión secuencial-
mente por co nce ntración de la función de verosimilitud, combinando el algoritmo
EM (Expectation-Maximization) con un método de búsqueda directa. En la quinta
sección, la metodología se aplica a un sistema de caudales de ríos colombianos en el
cual hay dos regímenes que se activa n mediante la variable del Índice de Oscilación
del Sur.
2. Formulación del modelo
Definición 1. Sea Z
t
una serie temporal k- dimensional, Z
t
= (z
1t
, z
2t
, . . . , z
kt
)
con media cero. Diremos que Z
t
se representa mediante un modelo factorial di-
námico threshold con c r e gímenes de órdenes p
1
, p
2
, . . . , p
c
y variable umbral w
t
,
Revista Colombiana de Estadística 31 (2008) 183–192
Modelo factorial dinámico threshold 185
si
Z
t
= Λf
t
+ u
t
;
f
t
=
p
j
P
i=1
φ
(j)
i
f
ti
+ Υ
(j)
a
t
, si w
td
(γ
j1
, γ
j
], j = 1, . . . , c.
(1)
donde w
t
es una va riable aleatoria unidimensional observable y e stacionaria, f
t
es un vector aleatorio r-dimensional no observable con media ce ro, u
t
es ruido
blanco k-dimensional con matriz de varianza-covarianza Σ
u
diagonal y definida
positiva, a
t
es un ruido blanco r-dimensional con matriz de varianza-covarianza la
identidad I
r
y tales que u
t
sea independiente de f
th
para h 0, a
t
independiente
de f
th
para h 1, { w
t
}, {u
t
} y {a
t
} independientes entre sí. Los parámetros del
modelo son los denominados parámetros umbral: −∞ = γ
0
< γ
1
< · · · < γ
c1
<
γ
c
= −∞, el entero positivo d, rezago de la va riable umbral, la matriz de carga
Λ, de dimensión (k × r) que debe s er tal que rango(Λ) = r y Λ
Λ = I
r
, I
r
matriz
identidad de or den r, y los parámetros que determinan la dinámica del factor,
φ
(j)
i
, Υ
(j)
j = 1, . . . , c, matrices de dimensión (r × r), con Υ
(j)
diagonal y definida
positiva.
El modelo propuesto detecta componentes comunes no lineales que puedan ser
representadas por modelos umbral y q ue involucren la dinámica propia del sistema.
La idea general es represe ntar el vector temp oral mediante la suma de dos com-
ponentes la tentes ortogonales: una común a las componentes del vector, descrita
por un proceso vectorial autorregre sivo threshold T AR, de dimensió n menor, y
otra específica a cada componente particular. La variable umbral w puede ser una
de las componentes estacionaria s del vector observado, z
jt
, j k, o una variable
exógena estacionaria que a fecte el estado del sistema, o una combinación de las
componentes de Z
t
. Esta combinación debe ser estaciona ria.
Mediante este modelo pueden salir a relucir características significativas en un
régimen y no en el otro. El proceso formulado para los factores permite tener en
consideración autorregresiones con órdenes diferentes en los regímenes. La serie de
los factores es generada por procesos diferentes en diferentes instantes de tiempo;
su cambio es consecuencia de un estado del sistema que se mantiene hasta que
determinada variable s obrepasa un valor umbral.
3. Propiedades del modelo
3.1. Identificación
El modelo propuesto hereda los problemas de identificación presentes en el
modelo factorial estático debido a la no obse rvabilidad de f . La imp osición de una
estructura T AR con c regímenes para los factor e s no evita la no identificación de
los parámetros. Efectivamente, si f
t
es un T AR r-dimensio nal con c regímenes de
órdenes p
1
, . . . , p
c
y variable umbral w
t
, entonces para cualquier matriz (r × r)
no singular C, el vector f
t
= Cf
t
será también un T AR r-dimensional para la
misma varia ble umbral, el mismo número de regímenes c y los mismos órdenes
Revista Colombiana de Estadística 31 (2008) 183–192
186 María Elsa Correal & Daniel Peña
autorregresivos dentro de cada régimen. Específicamente, f
t
se expresa como
f
t
=
p
j
X
i=1
φ
(j)
i
f
ti
+ Υ
(j)
a
t
, si w
td
(γ
j1
, γ
j
], j = 1, . . . , c
donde φ
(j)
i
= Cφ
(j)
i
C
1
y Υ
(j)
= CΥ
(j)
. Dicho de otra forma, para cualquier
matriz C no singular, los conjuntos
n
Λ, φ
(1)
1
, . . . , φ
(c)
p
c
, Υ
(1)
, . . . , Υ
(c)
, Σ
u
, d, γ
1
, . . . , γ
c
o
y
n
ΛC
1
, Cφ
(1)
1
C
1
, . . . , Cφ
(c)
p
c
C
1
, CΥ
(1)
, . . . , CΥ
(c)
, Σ
u
, d, γ
1
, . . . , γ
c
o
no pueden distinguirse a partir de las observaciones.
Proposición 1. Las restricciones Λ
Λ = I
r
y Υ
(j)
matriz diagonal y positiva
definida para j = 1, . . . , c, eliminan esta fuente de indeterminación.
Demostración . En efecto, si Λ y Λ
= ΛC
1
satisfacen la primera restric-
ción, Λ
Λ = I
r
y
)
Λ
= (C
1
)
C
1
= I
r
, entonces C será matriz ortogo-
nal. Además, si Υ
(j)
y Υ
(j)
= CΥ
(j)
satisfacen la se gunda restricción, entonces
C = Υ
(j)
(j)
)
1
y, por tanto, C es diagonal. Puesto que la única matriz orto go-
nal y diagonal es la matriz identidad, se concluye que C = I
r
.
Vale la p e na mencionar que la representación T AR de los factores en el mo delo
factorial dinámico threshold (1) puede escribirse como f
t
=
p
j
P
i=1
φ
(j)
i
f
ti
+ a
(j)
t
con
a
(j)
t
= Υ
(j)
a
t
. Puede verse entonces que la matriz de varia nza covarianza de a
t
puede restring irse a la identidad sin pérdida de generalidad.
3.2. Estructura para las matrices de covarianza rezagadas
Las matric e s de covarianza para diferentes rezagos contienen informac ión acerca
de la dinámica de la s interrelaciones entre las diferentes co mpo nentes del proceso.
Sean Γ
Z
(h) = E(Z
th
Z
t
), Γ
f
(h) = E(f
th
f
t
) y Σ
u
(h) = E(u
th
u
t
) para h =
0, 1, 2, . . . las matrices de covarianza rezaga das de Z, f y u respec tiva mente.
Proposición 2. Si Z
t
se representa mediante un modelo autorregresivo threshold,
rango
Z
(h)) = r, pa ra h = 1, 2, . . .
Demostración . En efecto, si f
t
es estacionario de segundo orden, Z
t
también lo
es, y puesto que Z
t
= Λf
t
+ u
t
, y u
t
es ruido blanco,
Γ
Z
(h) = ΛΓ
f
(h
, para h = 1, 2 , . . .
Esta propiedad es muy útil en la etapa de identificación del número de factores
comunes.
Revista Colombiana de Estadística 31 (2008) 183–192
Modelo factorial dinámico threshold 187
3.3. Modelo de rezagos distribuidos por regímenes
Proposición 3. Z
t
puede ex presarse como un modelo de rezagos distribuidos por
regímenes
Z
t
=
p
j
X
i=1
Λ
(j)
i
f
ti
+ ε
(j)
t
, si w
td
(γ
j1
, γ
j
], j = 1, . . . , c
donde los espacios nulos de Λ
(j)
i
comparten un subespacio común de dimensión
(k r).
Demostración . En efecto, remplazando la segunda ecuación de (1) en la pri-
mera se obtiene Λ
(j)
i
= Λφ
(j)
i
; por tanto, si M es una matriz k × (k r) cu-
yas columnas generan el espacio nulo de Λ
, M
Λ
(j)
i
= 0 para i = 1, . . . , p
j
,
j = 1, . . . , c. Sin embargo, las matrices Λ
(j)
i
no necesariamente tienen rango com-
pleto y rango
Λ
(j)
i
= rango
φ
(j)
i
.
El ruido asociado al modelo expresado en rezagos distribuidos es ε
(j)
t
=
ΛΥ
(j)
a
t
+ u
t
, y su matriz de covarianza, no necesariamente diagonal, viene dada
por
Ψ
(j)
ε
= ΛD
(j)
Λ
+ Ψ
u
, j = 1, . . . , c
con D
(j)
= Υ
(j)
Υ
(j)
matriz diagona l.
4. Estimación
Se propone estimar los parámetro s del modelo por máxima verosimilitud me-
diante un algoritmo que combina el principio del algoritmo EM con un método de
búsqueda directa. El procedimiento maximiza el logaritmo de la función de verosi-
militud L
w
Z
de forma secuencial, primero sobre ψ
1
=
Λ, Φ
(1)
, Φ
(2)
, Υ
(1)
, Υ
(2)
, Σ
u
y luego sobre ψ
2
= {d, γ}. Para d y γ fijos, el máximo sobre ψ
1
se obtiene mediante
un algoritmo EM . La utilización del algoritmo EM en el contexto de factores diná-
micos fue pro puesta inicialmente por Shumway & Stoffer (1982) y Watso n & Engle
(1983) y ha sido utilizada poster iormente por Wu et al. (19 96) y Peña & Poncela
(2006), entre otros. En la segunda eta pa, por búsqueda directa se encuentran los
valores
b
d y bγ que maximicen L
w
Z
. La búsqueda se re aliza para d {1 , . . . ,
¯
d},
¯
d una
cota para el retardo y γ {γ
1
, . . . , γ
L
}, conjunto formado por los cuantiles mues-
trales de la variable umbral escogidos de forma tal que en cada gimen se tengan
suficientes observaciones para estimar adecuadamente los parámetros asociados.
Siendo así las cosas, se tendrán que realizar
¯
d L veces el procedimiento EM .
Revista Colombiana de Estadística 31 (2008) 183–192
188 María Elsa Correal & Daniel Peña
Para d y γ fijos, el logaritmo de la función de verosimilitud de los datos com-
pletos, L
w
Z,f
(ψ
1
; ψ
2
), puede separarse por una función indicadora:
L
w
Z,f
(ψ
1
; ψ
2
) = cte
T
2
log |Σ
u
|
1
2
T
X
t=1
(Z
t
Λf
t
)
Σ
1
u
(Z
t
Λf
t
)
1
2
X
tI
1
log
Υ
(1)
Υ
(1)
1
2
X
tI
2
log
Υ
(2)
Υ
(2)
1
2
X
tI
1
(d,γ)
f
t+1
ϕ
(1)
X
t
Υ
(1)
Υ
(1)
1
f
t+1
ϕ
(1)
X
t
1
2
X
tI
2
(d,γ)
f
t+1
ϕ
(2)
X
t
Υ
(2)
Υ
(2)
1
f
t+1
ϕ
(2)
X
t
donde I
1
(d, γ) =
t {1, . . . , T }/w
td
< γ
, I
2
(d, γ) =
t {1, . . . , T }/w
td
γ
, X
t
= (f
t
, f
t1
, . . . , f
tp+1
)
vector rp × 1, y ϕ
(i)
=
h
φ
(i)
1
φ
(i)
2
· · ·
φ
(i)
p
i
matriz
r × rp, para i = 1, 2.
Utilizando la solución de la k- é sima iteración,
e
ψ
(k)
1
, la evalua c ión del paso E
del algoritmo
Q
ψ
1
;
e
ψ
(k)
1
= E
e
ψ
(k)
1
L
W
Z,f
(ψ
1
; ψ
2
)
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
(2)
se obtiene involucrando los algoritmos del filtro de Kalman y de suavización de
intervalo fijo aplicados a una representación espacio-estado del modelo. Como r e -
sultado de este paso, se obtienen las sucesiones
b
X
(k)
t|T
, P
(k)
t|T
, M
(k)
t|T
, t = 1, . . . , T ,
donde
b
X
(k)
t|T
= E
e
ψ
(k)
1
X
t
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
P
(k)
t|T
= E
e
ψ
(k)
1
h
X
t
b
X
t|T

X
t
b
X
t|T
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
i
M
(k)
t|T
= E
e
ψ
(k)
1
h
X
t+1
b
X
t+1|T

X
t
b
X
t|T
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
i
Teniendo en cuenta que f
t
= S
t
X
t
para S
=
I
r
| 0
r
| · · · | 0
r
, también se
obtienen las sucesiones
b
f
(k)
t|T
= E
e
ψ
(k)
1
f
t
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
= S
b
X
(k)
t|T
E
e
ψ
(k)
1
f
t
f
t
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
= S
P
(k)
t|T
+
b
X
(k)
t|T
b
X
(k)
t|T
S
E
e
ψ
(k)
1
f
t+1
X
t
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
= S
M
(k)
t|T
+
b
X
(k)
t|T
b
X
(k)
t|T
Revista Colombiana de Estadística 31 (2008) 183–192
Modelo factorial dinámico threshold 189
En la k-ésima iteración del paso M del algoritmo s e maximiza Q
ψ
1
;
e
ψ
(k)
1
con
respecto a ψ
1
. Se mostrará a continuación que la solución viene dada por
e
Λ
(k+1)
=
T
X
t=1
Z
t
b
f
(k)
t|T
!
T
X
t=1
b
f
(k)
t|T
b
f
(k)
t|T
+ P
(k)
!
1
e
Σ
(k+1)
v
=
1
T
T
X
t=1
Z
t
e
Λ
(k+1)
b
f
(k)
t|T

Z
t
e
Λ
(k+1)
b
f
(k)
t|T
+
e
Λ
(k+1)
P
(k)
e
Λ
(k+1)
!
eϕ
(j)
(k+1)
=
X
tI
j
b
f
(k)
t+1|T
b
X
(k)
t
+ V
(k)
j
!
X
tI
j
b
f
(k)
t+1|T
b
f
(k)
t+1|T
+ W
(k)
j
!
1
, j = 1, 2
e
Υ
(j)
(k+1)
=
1
T
j
X
tI
j
b
f
(k)
t+1|T
eϕ
(j)
(k+1)
b
X
(k)
t
b
f
(k)
t+1|T
eϕ
(j)
(k+1)
b
X
(k)
t
+ eϕ
(j)
(k+1)
W
(k)
j
eϕ
(j)
(k+1)
!
donde T
j
número de casos en el régimen j y las matrices P
(k)
, V
(k)
j
y W
(k)
j
están
dadas por
P
(k)
=
T
X
t=1
S
P
(k)
t|T
S, V
(k)
j
=
X
tI
j
S
M
(k)
t|T
, W
(k)
j
=
X
tI
j
S
P
(k)
t|T
S
para S
=
I
r
| 0
r
| · · · | 0
r
.
En efecto, el término que involucra a Λ en (2) es
E
T
X
t=1
Z
t
Λf
t
Σ
1
u
Z
t
Λf
t
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
!
que es igual a
traza
Σ
1
u
T
X
t=1
Z
t
Z
t
Λ
b
f
(k)
t|T
Z
t
Z
t
b
f
(k)
t|T
Λ
+ Λ
b
f
(k)
t|T
b
f
(k)
t|T
+ S
P
(k)
t|T
S
Λ
!
y, por tanto,
Q
Λ
= Σ
1
u
T
X
t=1
Z
t
b
f
(k)
t|T
+ Σ
1
u
Λ
T
X
t=1
b
f
(k)
t|T
b
f
(k)
t|T
+ S
P
(k)
t|T
S
Igualando a ce ro este sistema de derivadas parciales, se obtiene el resultado
para
e
Λ
(k+1)
.
Ahora, fijando
e
Λ
(k+1)
, la parte de E
L
W
Z,f
(ψ
1
; ψ
2
)
Z
1
, . . . , Z
T
, w
1
, . . . , w
T
que
involucra a Σ
u
puede escribirse como
T
2
log |Σ
u
|
1
2
×
traza
"
Σ
1
u
T
X
t=1
Z
t
e
Λ
(k+1)
b
f
(k)
t|T

Z
t
e
Λ
(k+1)
b
f
(k)
t|T
+
e
Λ
(k+1)
S
P
(k)
t|T
S
e
Λ
(k+1)
#
Revista Colombiana de Estadística 31 (2008) 183–192
190 María Elsa Correal & Daniel Peña
y entonces va le el resultado para
e
Σ
(k+1)
u
.
El resultado para eϕ
(j)
(k+1)
y
e
Υ
(j)
(k+1)
se prueba de forma similar. En este caso, apa-
rece E(f
t+1
X
t
), que involucra a V
(k)
= S
M
(k)
t|T
. Más detalles pueden consultarse
en Correal (2007).
El algoritmo proporcio na también el e stimador óptimo de los factores:
b
f
t|T
= E
f
t
| Z
1
, . . . , Z
T
, w
1
, . . . , w
T
5. Aplicación
El modelo y el método de estimación se aplican a un vector de dimensión 5 con-
formado po r los caudales de lo s ríos colombianos Calima, Cauca, Grande, Ovejas y
Prado, que pertenecen a la cuenca del Magdalena. Los datos históricos disponibles
abarcan un pe riodo de 36 años y corresponden al per iodo compre ndido entre enero
de 1955 y diciembre de 19 90, para un total de 432 observaciones mensuales.
El procedimiento se realizó en tres etapas resumidas a continuación. Los re-
sultados detallados pueden consultarse en Correal (2007). En la primera se probó
la hipótesis de que los caudales pres e ntan un comportamiento no lineal del tipo
threshold con variable umbral Índice de Oscilación del Sur, IOS, variable atmos-
férica relacionada con el evento climático del fenómeno de El Niño. La hipótesis se
contrastó mediante el test propuesto por Tsay (1989). Este se basa en autorregre-
siones reordenadas de acuerdo con la variable umbral w
td
. El test se aplicó para
los r e tardos d = 1, 2, . . . , 12 y pa ra los datos z
it
= (1 θB
12
)
1
(1 B
12
) log c
it
,
i = 1, . . . , 5; c
it
caudal del iésimo río en el instante t. De los nueve río s conside-
rados originalmente, los cinco utilizados en esta aplicación dieron significativos.
En la segunda etapa, se procedió a identificar el número de factores comunes.
Para esto se realizaron dos pruebas, ambas basadas en los vectores propios de
las matrices de autocovar ianza rezagadas observadas Γ
Z
(k) = E(Z
tk
Z
t
), y cu-
yos detalles pueden cons ulta rse en Peña & Poncela (2006) y Hu & Chou (2004).
Los resultados de estas pr uebas llevaron a plantear un modelo con dos factores
comunes.
En la tercera etapa se implementó el algoritmo para estimar los parámetros del
modelo. El algoritmo de búsqueda se realizó sobre el par de conjuntos {1, 2, . . . , 12}
para d y {−2.6, 2.5, . . . , 2.3} para γ, con lo que el algoritmo EM se corrió 60
veces.
El estimador del valor umbral fue bγ = 2.3. Puesto que los episodio s del
fenómeno de El Niño se presentan acompañados de valores nega tivos del Índice de
Oscilación al Sur, el régimen 1 puede asociars e a una de las fases del fenómeno.
El resultado para el rezago fue
b
d = 1 y la estimación para la matriz de carga del
modelo factorial dinámico threshold es
b
Λ =
0.29 0.54 0.34 0.47 0.52
0.94 0.05 0.06 0.23 0.22
Revista Colombiana de Estadística 31 (2008) 183–192
Modelo factorial dinámico threshold 191
La estimación de la matriz de varianzas de los término s espec íficos es
b
Σ
u
=
diag(0.0 16, 0.006, 0.032 , 0.040, 0.201), y el modelo estimado para el factor es
f
1t
f
2t
=
0.70 0.00
0.00 0.55
f
1,t1
f
2,t1
+
a
1t
a
2t
si IOS
t1
< 2.3
f
1t
f
2t
=
0.78 0.00
0.00 0.67
f
1,t1
f
2,t1
+
a
1t
a
2t
si IOS
t1
2.3
donde cov
a
(1)
t
= diag(0.30, 0.08), cov
a
(2)
t
= diag(0.27 , 0.04 ) para
a
(1)
t
=
a
(1)
1t
, a
(1)
2t
y a
(2)
t
=
a
(2)
1t
, a
(2)
2t
.
6. Conclusiones
El modelo presentado en este trabajo permite analizar sistemas de series tem-
porales que presenten efectos no lineales del tipo threshold. El modelo puede inter-
pretarse o bien como una reparametriz ación del mo delo T AR vectorial, que reduce
significativamente el número de parámetros, o bien como una extensión del modelo
de Peña y Box que permite tener en cuenta efectos no linea les. El vector de los
factores comunes se representa mediante diferentes proceso s autorregresivos que
se activan cuando determinada variable sobrepasa un valor umbral. Los diferen-
tes regímenes pueden relacionarse con los estados de una economía o con estado s
propios de la naturaleza, como e l caso que se estudia en la aplicación, donde lo s
estados están as ociados a la presencia o ausencia del fenómeno de El Niño.
Agradecimientos
Este artículo es producto del trabajo de tesis del primer autor (Cor real 2007)
para obtener el título de doctor en Estadística de la Universidad Nacional de
Colombia.
Recibido: marzo de 2008 Aceptado: s eptiembre de 2008
Referencias
Correa l, M. E. (2007), Modelo factorial dinámico con efectos umbral, Tesis docto-
ral, Departamento de Estadística, Facultad de Ciencias, Universidad Nacional
de Colombia.
Forni, M., Hallin, M., Lippi, M. & Reichlin, L. (2 005), ‘The Generalized Dyna-
mic Facto r Model: One-Sided Estimation and Forec asting’, Journal of the
American Statistical Association 100, 8 30–840.
Revista Colombiana de Estadística 31 (2008) 183–192
192 María Elsa Correal & Daniel Peña
Gonzalo, J. & Pitarakis, J. Y. (2002), ‘Estimation and Model Selection Bas ed
Inference in Single and Multiple Threshold Models’, Journal of Econometrics
110, 319–352.
Hansen, B. E. (1997), ‘Inference in TAR Models’, St udies in Nonlinear Dynamics
and Econometrics 2 , 1–14.
Hansen, B. E. (2000), ‘Sample Splitting and Thresho ld Estimation’, Econometrica
68, 575–603.
Hu, Y. P. & Chou, R. J. (2004), ‘On the Peña-Box Model’, Journal of Time Series
Analysis 25, 811–830.
Peña, D. & Box, G. E. P. (1987), ‘Identifying a Simplifying Structure in Time
Series’, Journal of the American Statistical Association 82, 83 6–843.
Peña, D. & Poncela, P. (2004), ‘Forecasting w ith Nonstationary Dynamic Fac tor
Models’, Journal of Econometrics 119, 291–321.
Peña, D. & Poncela, P. (2006), ‘Nonstationary Dynamic Factor Models’, Journal
of Statistical Planning and Inference 136, 1237–1257.
Shumway, R. H. & Stoffer, D. S. (1982), ‘An Approach to Time Series Smoothing
and For e c asting Using the EM Algorithm’, Journal of Time Series Analysis
3, 253–264.
Sto ck, J. H. & Watson, M. W. (2002), ‘Forecasting Using Principal Components
From a Large Number of Predictors’, Journal of the American Statistical
Association 97, 116 7–1179.
Tong, H. & Lim, K. S. (1 980), ‘Threshold Autoregression, Limit Cycles and Cy-
clical Data’, Journal of The Royal Statistics Society Ser. B(4), 245 –292.
Tsay, R. S. (1989 ), ‘Outliers, Level Shifts and Variance Changes in Time Series’,
Journal of Forecasting 7, 1–20.
Tsay, R. S. (1998), ‘Testing and Modeling Multivariate Threshold Models’, Journal
of the American Statistical Association 93, 1188–1202.
Watson, M. W. & Engle, R. F. (1983), ‘Alternative Algorithms for the Estima-
tion of Dyna mic Fa c tor, Mimic and Varying Coe fficient Regression Models’,
Journal of Econometrics 23, 385–400.
Wu, L. S., Pai, J. S. & Hosking, J. R. M. (1996), ‘An Algor ithm for Estimating
Parameters of State-Space Models’, Statistics & Probability Letters 28, 99–
106.
Revista Colombiana de Estadística 31 (2008) 183–192
... Uno de los dos métodos considerados en esta investigación, el método dePeña & Box (1987), está restringido a series estacionarias, y tiene como herramienta principal las matrices de autocovarianzas muestrales. Debido a la popularidad de este método, ha sido extendido para series no estacionarias porPeña & Poncela (2006) y para series no lineales porCorreal & Peña (2008). Por otro lado, en el enfoque del dominio de las frecuencias, se encuentra el métodode Stoffer (1999) para detectar señales comunes en una determinada frecuencia y el métodode Brillinger (1981). ...
Article
Full-text available
Two methods of dimensionality reduction of multivariate stationary time series are analyzed: Peña-Box's methodology in the time domain and Bri-llinger's methodology in the frequency domain. Two failures of Peña-Box's methodology were found, and their corrections are given. Also the two me-thods are compared regarding to their capacities to identify the number of latent factors by simulations and an empirical application.
... Uno de los dos métodos considerados en esta investigación, el método dePeña & Box (1987), está restringido a series estacionarias, y tiene como herramienta principal las matrices de autocovarianzas muestrales. Debido a la popularidad de este método, ha sido extendido para series no estacionarias porPeña & Poncela (2006) y para series no lineales porCorreal & Peña (2008). Por otro lado, en el enfoque del dominio de las frecuencias, se encuentra el métodode Stoffer (1999) para detectar señales comunes en una determinada frecuencia y el métodode Brillinger (1981). ...
Article
Full-text available
En este trabajo se analizan dos métodos de reducción de dimensionalidad en series de tiempo multivariadas estacionarias: el método de Peña y Box, basado en el dominio del tiempo, y el método de Brillinger, basado en el dominio de las frecuencias. Se encontraron dos fallas en el método de Peña y Box, y se propusieron correcciones a estas. También se compararon los dos métodos con respecto a la capacidad para identificar el número de factores latentes mediante simulaciones y se realizó una aplicación empírica.
Article
En este documento se estima un modelo VAR estructural para iden-tificar las causas de la inflación en el Ecuador. La contribución de las variables exógenas en la inflación se analiza utilizando la descomposición de la varianza. A diferencia de estudios anteriores, no sólo se identi-fica el impacto de cada variable exógena en la tasa de inflación, sino que además se estima la tasa de inflación a partir de las variables exógenas del modelo. Los resultados muestran que en el primer trimestre del 2008 los principales determinantes de la inflación en el Ecuador fueron los precios internacionales, los tipos de cambio y las políticas públicas. por su excelente asistencia en esta investigación; y, Miguel Acosta y Kléver Mejía por sus comentarios a versiones pre-liminares de este documento. Al momento de participar en esta investigación, Wilson Pérez trabajaba en la Dirección de Investigaciones Económicas del Banco Central del Ecuador. Las opiniones, errores y omisiones son de responsabilidad exclusiva de los autores y no nece-sariamente reflejan la posición del Banco Central del Ecuador, ni de sus autoridades. Para cualquier comentario o sugerencia favor comunicarse con igachet@bce.ec, dmaldonado@bce.ec y/o wperez@usfq.edu.ec.
Article
In this paper we estimate a structural VAR model to identify the causes of inflation in Ecuador. To examine the VAR dynamics, we use the decomposition of the variance because it provides information about the relative importance of each shock to the variables in the VAR. We differ from previous studies because we are able not only to identify the impact of each exogenous variable on the inflation rate but also to estimate the inflation rate from the exogenous variables in the model. We found that on the first quarter of 2008 the annual inflation rate in Ecuador was mainly caused by international prices, exchange rates and public policy.
Article
Full-text available
This article studies how to identify hidden factors in multivariate time series process. This problem is important because, when the series are driven by a set of common factors, (a) a large number of parameters may be needed to obtain an adequate representation of the system and (b) the estimated parameters will be highly correlated. Therefore, a complex and badly defined relationship can appear when, in fact, a simpler and parsimonious model in terms of a few common factors can be operating. This article develops a methodology to identify the number of factors and to build a simplifying transformation to represent the series. It is proved that the number of factors is equal to the rank of the covariance matrices and the parameter matrices of the infinite moving average representation of the process. The eigenvectors of these matrices will provide the canonical transformation. The method is illustrated with one example, using series of the price of wheat in five provinces of Spain in the 19th century. The standard approach to build a vector autore-gressive integrated moving average model showed a complex relationship with all kinds of feedback operating. When the methodology developed in the article was applied, however, two factors were identified and a clearer and simpler representation of the system was achieved.
Article
Threshold autoregressive models in which the process is piecewise linear in the threshold space have received much attention in recent years. In this article I use predictive residuals to construct a test statistic for detecting threshold nonlinearity in a vector time series and propose a procedure for building a multivariate threshold model. The thresholds and the model are selected jointly based on the Akaike information criterion. The finite-sample performance of the proposed test is studied by simulation. The modeling procedure is then used to study arbitrage in security markets and results in a threshold cointegration between logarithms of future contracts and spot prices of a security after adjusting for the cost of carrying the contracts. In this particular application, thresholds are determined in part by the transaction costs. I also apply the proposed procedure to U.S. monthly interest rates and two river flow series of Iceland.
Article
This article considers forecasting a single time series when there are many predictors (N) and time series observations (T). When the data follow an approximate factor model, the predictors can be summarized by a small number of indexes, which we estimate using principal components. Feasible forecasts are shown to be asymptotically efficient in the sense that the difference between the feasible forecasts and the infeasible forecasts constructed using the actual values of the factors converges in probability to 0 as both N and T grow large. The estimated factors are shown to be consistent, even in the presence of time variation in the factor model.
Article
. An approach to smoothing and forecasting for time series with missing observations is proposed. For an underlying state-space model, the EM algorithm is used in conjunction with the conventional Kalman smoothed estimators to derive a simple recursive procedure for estimating the parameters by maximum likelihood. An example is given which involves smoothing and forecasting an economic series using the maximum likelihood estimators for the parameters.
Article
Outliers, level shifts, and variance changes are commonplace in applied time series analysis. However, their existence is often ignored and their impact is overlooked, for the lack of simple and useful methods to detect and handle those extraordinary events. The problem of detecting outliers, level shifts, and variance changes in a univariate time series is considered. The methods employed are extremely simple yet useful. Only the least squares techniques and residual variance ratios are used. The effectiveness of these simple methods is demonstrated by analysing three real data sets.
Article
A distribution theory is developed for least-squares estimates of the threshold in Threshold Autoregressive (TAR) models. We find that if we let the threshold effect (the difference in slopes between the two regimes) become small as the sample size increases, then the asymptotic distribution of the threshold estimator is free of nuisance parameters (up to scale). Similarly, the likelihood ratio statistic for testing hypotheses concerning the unknown threshold is asymptotically free of nuisance parameters. These asymptotic distributions are nonstandard, but are available in closed form, so critical values are readily available. To illustrate this theory, we report an application to the U.S. unemployment rate. We find statistically significant threshold effects.
Article
In this paper we analyze the structure and the forecasting performance of the dynamic factor model. It is shown that the forecasts obtained by the factor model imply shrinkage pooling terms, similar to the ones obtained from hierarchical Bayesian models that have been applied successfully in the econometric literature. Thus, the results obtained in this paper provide an additional justification for these and other types of pooling procedures. The expected decrease in MSE for using a factor model versus univariate ARIMA and shrinkage models are studied for the one factor model. Monte Carlo simulations are presented to illustrate this result. A factor model is also built to forecast GNP of European countries and it is shown that the factor model can provide a substantial improvement in forecasts with respect to both univariate and shrinkage univariate forecasts.
Article
This paper evaluates the properties of a joint and sequential estimation procedure for estimating the parameters of single and multiple threshold models. We initially proceed under the assumption that the number of regimes is known á priori but subsequently relax this assumption via the introduction of a model selection based procedure that allows the estimation of both the unknown parameters and their number to be performed jointly. Theoretical properties of the resulting estimators are derived and their finite sample properties investigated.
Article
We describe an algorithm for estimating the parameters of time-series models expressed in state-space form. The algorithm is based on the EM algorithm, and generalizes an algorithm given by Shumway and Stoffer (1982)