©陈强,《计量经济学及Stata应用》,2014年。请勿上传,cause什么意思

什么意思 6
©陈强,《计量经济学及Stata应用》,2014年。
请勿上传或散发。
第12章平稳时间序列根据时间序列的随机过程特性,可分为“平稳序列” (stationary)与“非平稳序列”(non-stationary)两大类,需使用不同的计量方法。
本章介绍平稳序列,下一章介绍非平稳序列。

1 12.1时间序列的数字特征 对于离散时间1,
2,,T,记随机变量y的相应观测值为y1,y2,,yT,并假设其为(严格)平稳过程。
该时间序列的期望、方差、自协方差、自相关系数等数字特征均不随时间推移而改变。
考察时间序列的数字特征,有助于判别应该使用怎样的时间序列模型进行估计。
期望E(y)反映的是该序列的平均水平,可以用样本
2 均值y1T Tt1yt来估计。
方差Var(y)反映的是该序列的波动幅度,可以用 
1 T
1 Tt1(yty)2来估计。
定义时间序列yt的“k阶自协方差”(autocovariance oforderk)为 kCov(yt,ytk)E(yt)(ytk) 其中,E(y)。
它反映同一变量(y)相隔k期之间的自相关程度。
当k0时,0Var(y)。
对k的估计值为“样本自协方差”:
3 ˆkT1kTt1k(yty)(ytky) 定义时间序列yt的“k阶自相关系数”(autocorrelation oforderk)为 kCorr(yt,ytk)CoVv(ayrt(,yy)tk)t 它将自协方差标准化为介于1,1之间的量。
对于严格平稳过程,k不依赖于时间,仅是滞后阶数k的函数,称为“自相关函数”(AutocorrelationFunction,
4 简记为ACF)。
将(k,k)画成图,即为“自相关图”(correlogram)。
由于自相关函数关于原点对称(kk),故一般只画自相关图的正半边。
对k的估计值为“样本自相关系数”: ˆkˆkˆ
0 但yt与ytk之间的相关性可能由二者之间的变量 yt
1,,ytk1所引起,而kCorr(yt,ytk)并未对
5 yt
1,,ytk1的作用进行控制。
定义时间序列yt的“k阶偏自相关系数”(partial autocorrelationoforderk)为 k*Corr(yt,ytk|yt
1,,ytk1) 即给定yt
1,,ytk1条件下,yt与ytk的条件相关系数。
k*也只是k的函数,故称为“偏自相关函数”(PartialAutocorrelationFunction,简记PACF)。
\
6 为估计ˆk*,对以下k阶自回归方程进行OLS估计: yt01yt1kytkt 则ˆk就是“k阶样本偏自相关系数”ˆk*。
时间序列的数字特征,是时间序列固有的特征,不依赖于模型的设定。
在设定模型时,则希望尽可能地与这些数字特征相一致。

7 12.2自回归模型如果从一个客户的角度仅关心某变量(比如股价)的未 来值,则可以用该变量的过去值来预测其未来值(因为时间序列一般存在自相关)。
这种模型被称为“单变量时间序列”(univariatetimeseries)。
此时,可以不必理会因果关系,只考虑相关关系即可。
比如,看到街上有人带伞,可以预测今天要下雨,但行人带伞并不导致下雨。

8 对于样本数据y1,y2,,yT,最简单的预测方法为一阶 自回归(AR
(1)): yt01yt1t(t
2,,T) 其中,扰动项t为白噪声,满足零期望E(t)
0,同方差 Var(t )   2 ,且无自相关 Cov(t ,  s ) 
0, t s。
假设1
1,则yt为渐近独立的平稳过程(ergodic stationary)。
由于yt1依赖于t
1,,1,而t与t
1,,1不相关,故 yt1与t不相关,故OLS一致。
但使用OLS只能用观测
9 值t
2,,T进行回归,将损失一个样本容量。
为了提高估计效率,考虑最大似然估计。
假设  t  为 独 立 同 分 布 , 且 服 从 正 态 分 布
N (
0,  2
 ) 。
由于yt为平稳过程,其期望与方差均不随时间而变。
对方程两边同时取期望可得 E(y)01E(y) 经移项整理可知,y的无条件期望为
0。
t 1
1 10 对方程两边同时取方差可得 Var( y)  12 Var( y)   2 故yt的无条件方差为122。

1 因此,y 服从正态分布
N  
0 , 
2 ,其(无条件)密度函
1 11112 数为 fy(y1)
1 1 y10(11)2 exp 22(12) 22(112)  
1   11 在给定y1的条件下,y2的条件分布为, y2 y1 ~ N(
0  
1 y1 ,  2 ) ,其条件密度为 fyy(y2y1)21
1 exp  ( y2  
0  1y1)
2  22 2
2  则y1与y2的联合分布密度为 fy,y(y1,y2)fy(y1)fy|y(y2|y1) 12
1 21 依次类推得,ytyt1~N(01yt
1,2),t
2,,
T。
12 写出整个样本数据y1,y2,,yT的联合概率密度
T fy,,y(y1,,yT)fy(y1)
1 T
1 fyt|yt1(yt|yt1) t
2 取对数可得对数似然函数: ln L(
0,
1 ,  2 ; y1,, yT )  ln fy (y1) 
1 Tt2lnfyt|yt1(yt|yt1) 代入fy(y1)与fy|y(yt|yt1)的表达式可得
1 tt
1 13 lnL1ln21ln2(12)y10(11)
2 2 2 1 22(112) T21ln2T21ln2 T(yt01yt1)
2 t
2 2
2 寻找最优参数 ( 
0 , 
1 ,  2 ) ,使得 ln
L 最大化,此估计量称为 “精确最大似然估计量”(ExactMLE)。
如果样本容量T较大,则第一个观测值对似然函数的 贡献较小,可以忽略;即考虑给定y1的情况下,y2,,yT 的条件分布,则对数似然函数简化为 14 lnLT21ln2T21ln2 T(yt01yt1)
2 t
2 2
2 最大化上式所得到的估计量称为“条件最大似然估计 量”(conditionalMLE)。
上式右边第一项不含任何参数(可视为常数),第二项仅与2有关,而在第三项中2仅出现于分母。
为使上式最大化,须让上式右边第三项的分子最小化: min 
0,1 Tt2(yt01yt1)
2 其结果与OLS估计一样。
15 更一般地,考虑p阶自回归模型,记为AR(p): yt01yt1pytpt 对AR(p)的估计与AR
(1)类似。
在使用“条件MLE” 时,考虑在给定y1,,yp情况下,yp
1,,yT的条件分布。
通常不知道滞后期p。
在实践中如何估计pˆ? 方法一:设一个最大滞后期pmax,然后令pˆpmax进行估计,并对最后一个滞后期系数的显著性进行t检验。
如果接受该系数为
0,则令pˆpmax
1,重新进行估计,再对(新的)最后一个滞后期的系数进行t检验,如果显著, 16 则停止;否则,令pˆpmax2;以此类推。
这个准则被称为“由大到小的序贯t规则”(general-to-specificsequentialtrule)。
方法二:使用信息准则,选择pˆ使得AIC或BIC最小化,分别记为pˆAIC与pˆBIC。
比如, minAIClnSSRT2(p1) p
T 其中,SSR为残差平方和。
可以证明,pˆBIC是真实滞后阶 数p的一致估计,pˆAIC在大样本中可能高估p,但在小样 本中难分优劣。
17 在实践中,可以结合以上两种方法来确定pˆ。
如果二者不一致,为了保守起见(即尽量避免遗漏变量偏差),可取二者滞后阶数的大者。
12.3移动平均模型另一类时间序列模型为“移动平均过程”(Moving AverageProcess,简记MA)。
记一阶移动平均过程为MA
(1): yttt
1 其中,t为白噪声,而t的系数被标准化为
1。
由于yt可 18 以被看成是白噪声的移动平均,故得名。
考虑使用条件MLE估计。
假设t为独立同分布且服从 正 态 分 布
N (
0,  2 ) 。
如 果 已 经 知 道  t 
1 , 则 ①② yt t
1 ~ N(   t 
1 ,  2 ) 假设0
0,则可以知道1y1,故可得y2|
1。
而给定
1,则可以知道2y2
1,故可得y3|
2。
19 以此类推,可使用递推公式“tytt1”计算出全 部
1,2,,T。
在给定00的条件下,可写下样本数据y1,y2,,yT的似 然函数,然后使用数值方法求解其最大化问题。
更一般地,对于q阶移动平均过程,记为MA(q): ytt1t12t2qtq 进行条件MLE估计,即在给定“01q10”的条件下,最大化样本数据的似然函数。
20 12.4ARMA将AR(p)与MA(q)结合起来,得到ARMA(p,q): yt01yt1pytpt1t1qtq 其中,t为白噪声。
在给定y1,,yp与 “01q10”的条件下,可使用条件MLE来估计ARMA(p,q)。
如何估计(pˆ,qˆ)?在实践中,常常先考察数据的自相关函数(ACF)与偏自相关函数(PACF),以判断是否存在p0或q0的情形。
21 如果p
0,则为MA(q): ytt1t12t2qtq 如果jq,则Cov(yt,ytj)
0,因为产生yt的扰动项 t,t
1,,tq与产生ytj的扰动项tj,tj
1,,tjq没有 重叠的部分(无交集)。
故对于MA(q)模型,ACF函数在jq时都等于零,即出现“截尾”。
对于AR
(1),其ACF函数呈指数衰减,称为“拖尾”(tailsofftozero),不存在截尾。
22 如果q
0,则ARMA(p,q)简化为AR(p)模型: yt01yt1pytpt 假设真实模型为AR(p),却用OLS来估计AR(p+1),即yt01yt1pytpyp1tp1t,则plimˆp1
0,因为 T p1
0。
而ˆp1正是对(p1)阶偏自相关函数的估计。
故对于AR(p)模型,PACF函数在jp时都等于零,即出现截尾。
对于MA(q)模型,PACF函数逐渐衰减,即拖尾,不存在截尾。
23 综上所述,对于AR(p)模型,其ACF函数拖尾,而PACF函数截尾。
如果出现这种情形,则可判断其为AR(p),不包含移动平均的部分。
另一方面,对于MA(q)模型,其ACF函数截尾,而PACF函数拖尾。
如果出现这种情形,则可判断其为MA(q),不包含自回归的部分。
如果以上两种情形均不符合,即ACF函数与PACF函数都拖尾,则要考虑一般的ARMA(p,q)模型,其中p,q均不为零。
24 Box,JenkinsandReinsel(1994)认为,对大多数情况,p2与q2就足够了。
为保险起见,可让pmax与qmax更大些。
具体如何确定p,q,则可以依据信息准则或由大到小的序贯t规则。
③ 在估计完模型之后,需进行诊断性分析(diagnosticchecking),以确定ARMA(p,q)模型的假定是否成立。
其 中,最重要的假定是,扰动项t为白噪声。
如果模型 过小(inadequate),即pˆp或qˆq,则相当于遗漏解释变量。
这些被遗漏的解释变量被纳入扰动项中,导致扰动 25 项出现自相关,不再是白噪声。
可使用BG检验或Q检验来检验模型的残差是否存在 自相关。
如果残差存在自相关,则应考虑使模型更大些(增加自 回归或移动平均的阶数),重新对模型进行估计,然后再检验新模型的残差是否为白噪声,如此反复,直至确认残差为白噪声。
26 对于ARMA(p,q),是否需要使用异方差自相关稳健的HAC标准误?不需要!因为只要包含足够多的自回归滞后项,则扰动项为白噪声,无自相关。
可以使用异方差稳健的标准误,甚至普通标准误(时间序列通常不存在异方差)。
27 12.5自回归分布滞后模型在自回归模型中,可引入其他变量来构成“自回归分 布滞后模型”(AutoregressiveDistributedLagModel,简记ADL(p,q)): yt01yt1pytp1xt1qxtqt 例记通货膨胀率为t,失业率为unt,考虑以下模型 t01t12t23t34t41unt1t 此ADL(4,1)是宏观经济学中的经验菲利普斯曲线(empiricalPhillipCurve)。
如果1
0,则失业率越低,物 28 价越有上涨的压力。
另一方面,通胀的调整也受到过去通胀变化的滞后作用。
也可引入更多的解释变量。
比如,共有K个解释变量 x1t,,xKt,其中第j个解释变量xjt共有qj个滞后值被包 括在模型中,j
1,,K: yt01yt1pytp11x1,t11qx1,tq
1 1 K1xK,t1KqKxK,tqKt 如果自回归分布滞后模型满足以下假定,则万事大吉,可以用OLS来估计它。
29 (i)E(t|yt1,yt
2,,x1,t1,x1,t
2,,xK,t1,xK,t
2,)
0。
此假定类似于严格外生性假设,它意味着扰动项t与所有解释变量的整个历史全部无关。
这保证了对滞后期数(p,q1,,qK)的设定是正确的。
如果滞后期数的设定不正确,比如,真实模型还应该包括yt(p1),但该项p1yt(p1)却被纳入扰动项t中,则扰动项t便与解释变量相关,导致OLS不一致。
(ii)yt,x1t,,xKt为渐近独立的平稳序列。
(iii)yt,x1t,,xKt有非零的有限四阶矩。
30 (iv)解释变量无完全多重共线性。
对滞后期数的选择可以使用信息准则(最小化AIC或BIC),或使用t,F检验来检验最后一期系数的显著性。
更一般地,可以在ARMA模型中引入其他变量,称为“ARMAX”模型。
31 12.6ARMA模型的Stata命令及实例
1.自相关与偏自相关 corrgramy,lags(#)(计算第1至第#阶ACF与 PACF,以及检验自相关的Q统计量) acy,lags(#) (画成自相关图,给出置信区间) pacy,lags(#)(画偏自相关图,给出置信区间)
2.ARMA arimay,ar(1/#)ma(1/#)其中,选择项“ar(1/#)”表示第1至第#阶自回归,而“ma(#)”表示第1至第#阶移动平均。
ARMA的另一等价命令格式为 32 arimay,arima(#p,#d,#q) 其中,“#p”表示自回归的阶数,“#q”表示移动平均 的阶数,而“#d”表示原序列yt需要经过几次差分才 是平稳过程(参见第13章)。
下面检验其残差项是否存在 自相关: predicte1,res (计算残差,命名为e1) corrgrame1,lags(#)(检验残差是否存在第
1 至第#阶自相关的Q检验)
3.ADL与ARMAX ARMAX的Stata命令为arimayx1x2x3,ar(#)ma(#)④ 33 以数据集pe.dta为例。
该数据集的主要变量logpe为1871—2002年美国标准普尔股指(S&P)的市盈率(priceearningratio)的对数。
由于logpe为非平稳序列,故对其差分建立ARMA模型。
首先,定义其一阶差分为“d_logpe”: .usepe.dta,clear.tssetyear timevariable:year,1871to2002delta:1unit .gd_logpe=d.logpe计算其前10阶自相关与偏自相关系数:.corrgramd_logpe,lags(10) 34 LAG AC PAC
Q Prob>Q[Autocorrelation][PartialAutocor]
1 0.06510.0652.567410.4513
2 -0.1661-0.17234.29510.1168
3 -0.0611-0.03934.80310.1868
4 -0.1796-0.21179.23050.0556
5 -0.0530-0.05259.61960.0868
6 0.08970.023210.7410.0967
7 0.12880.092713.070.0704
8 -0.0050-0.042513.0740.1093
9 -0.01630.013213.1120.1576 10 0.05830.091713.6010.1920 上表显示,直至第4阶的Q统计量较为显著(p值为0.0556)。
更直观地,可以考察自相关图与偏自相关图: .acd_logpe,lags(10) 0.20 0.10 0.00 Autocorrelationsofd_logpe -0.10 -0.20
0 2
4 6 Lag Bartlett'sformulaforMA(q)95%confidencebands
8 10 35 .pacd_logpe,lags(10) 0.20 0.10 0.00 Partialautocorrelationsofd_logpe -0.10 -0.20
0 2
4 6 Lag 95%Confidencebands[se=1/sqrt(n)]
8 10 以上两图显示,第4阶自相关与偏自相关系数均在5%水平显著地不为0(落在95%的置信区间之外),而可以认为4阶以上的自相关与偏自相关系数为
0。
由于自相关系数与偏自相关系数均存在断尾,故分别考虑AR
(4)与MA
(4)模型。
首先,估计AR
(4)模型: 36 .arimad_logpe,ar(1/4)nolog ARIMAregression Sample:1872-2002Loglikelihood=43.35448 NumberofobsWaldchi2
(4)Prob>chi2 = 131 = 10.14 =0.0382 d_logpe Coef. OPGStd.Err. zP>|z| [95%Conf.Interval] d_logpe_cons .0084227.0119439 0.710.481-.0149868.0318322 ARMA ar L1. .0601002.0832216 0.720.470-.1030112.2232117 L2.-.2029129.081432-2.490.013-.3625167-.0433091 L3.-.0228198.0854787-0.270.789-.1903549.1447153 L4. -.206651.0875637-2.360.018-.3782728-.0350293 /sigma .1736352.011207215.490.000 .1516695 .195601 Note:Thetestofthevarianceagainstzeroisonesided,andthetwo-sidedconfidenceintervalistruncatedatzero. 计算信息准则:.estatic 37 Model. Obsll(null)ll(model) df AIC BIC 131 .43.35448 6-74.70897-57.45779 Note:N=ObsusedincalculatingBIC;see[R]BICnote 检验其残差项是否存在自相关:.predicte1,res(1missingvaluegenerated).corrgrame1,lags(10) LAG AC PAC
Q Prob>Q[Autocorrelation][PartialAutocor]
1 -0.0100-0.0100.013270.9083
2 -0.0003-0.0004.013290.9934
3 0.01030.0106.02760.9988
4 -0.0033-0.0031.02910.9999
5 -0.0328-0.0341.177650.9993
6 0.02560.0260.268790.9996
7 0.09120.09651.43760.9844
8 -0.0211-0.01901.50050.9927
9 -0.0429-0.04811.76380.9947 10 0.07830.08012.64690.9886 结果表明,可以接受残差项“无自相关”的原假设(检验至第10阶自相关)。
38 其次,估计MA
(4)模型:.arimad_logpe,ma(1/4)nolog ARIMAregression Sample:1872-2002Loglikelihood=42.69439 NumberofobsWaldchi2
(4)Prob>chi2 = 131 = 8.78 =0.0669 d_logpe Coef. OPGStd.Err. zP>|z| [95%Conf.Interval] d_logpe_cons .0080427.0111621 0.720.471-.0138347 .02992 ARMA ma L1. .0478866.0841641 0.570.569-.1170719.2128451 L2.-.1875636.0868965-2.160.031-.3578777-.0172496 L3.-.0400797.0922776-0.430.664-.2209405.1407812 L4.-.1462202.0904237-1.620.106-.3234474.0310071 /sigma .1745448.010863216.070.000 .1532533.1958363 Note:Thetestofthevarianceagainstzeroisonesided,andthetwo-sidedconfidenceintervalistruncatedatzero. 下面计算信息准则:.estatic 39 Model Obsll(null)ll(model) df AIC BIC . 131 .42.69439 6-73.38878-56.1376 Note:N=ObsusedincalculatingBIC;see[R]BICnote 检验其残差项是否存在自相关:.predicte2,res(1missingvaluegenerated).corrgrame2,lags(10) 40 LAG AC PAC
Q Prob>Q[Autocorrelation][PartialAutocor]
1 0.00820.0082.008980.9245
2 -0.0137-0.0139.034480.9829
3 -0.0033-0.0031.035950.9982
4 -0.0276-0.0282.140150.9977
5 -0.0502-0.0522.488980.9925
6 0.08730.09081.55090.9560
7 0.09560.09862.83380.8999
8 0.00240.00252.83460.9443
9 -0.0390-0.04263.05210.9622 10 0.06870.07743.73080.9587 上表显示,MA
(4)的残差项也不存在自相关。
根据信息准则,AR
(4)模型似乎略优于MA
(4)模型。
然而,两个模型中的第1阶与第3阶系数均不显著。
为此,考虑更为简洁的模型,将AR
(4)与MA
(4)模型中的第1阶与第3阶变量略去: .arimad_logpe,ar(24)nolog ARIMAregressionSample:1872-2002Loglikelihood=43.02852 NumberofobsWaldchi2
(2)Prob>chi2 = 131 = 11.61 =0.0030 d_logpe Coef. OPGStd.Err. zP>|z| [95%Conf.Interval] d_logpe_cons .0083801.0114639 0.730.465-.0140888.0308489 ARMA ar L2. -.201582.0788054-2.560.011-.3560378-.0471263 L4.-.2119179.0841825-2.520.012-.3769126-.0469231 /sigma .1740682.011092315.690.000 .1523277.1958086 Note:Thetestofthevarianceagainstzeroisonesided,andthetwo-sidedconfidenceintervalistruncatedatzero. .estatic Model Obsll(null)ll(model) df AIC BIC . 131 .43.02852 4-78.05704-66.55625 Note:N=ObsusedincalculatingBIC;see[R]BICnote .arimad_logpe,ma(24)nolog 42 ARIMAregressionSample:1872-2002Loglikelihood=42.4702 NumberofobsWaldchi2
(2)Prob>chi2 = 131 = 9.66 =0.0080 d_logpe Coef. OPGStd.Err. zP>|z| [95%Conf.Interval] d_logpe_cons .0080273.0108818 0.740.461-.0133006.0293552 ARMA maL2.-.1809963.0866252-2.090.037-.3507785-.011214L4.-.1563501.0865606-1.810.071-.3260057.0133055 /sigma .1748415.010720916.310.000 .1538288.1958541 Note:Thetestofthevarianceagainstzeroisonesided,andthetwo-sidedconfidenceintervalistruncatedatzero. .estatic Model Obsll(null)ll(model) df AIC BIC . 131 . 42.4702
4 -76.9404-65.43961 Note:N=ObsusedincalculatingBIC;see[R]BICnote 上表显示,略去第1与第3阶变量的简洁模型,其信息准则比完整模型更优。
根据此标准,似乎略去第1阶 43 与第3阶变量的AR
(4)模型最为合适。
12.7误差修正模型ADL是一种动态模型。
从经济理论而言,相关的变量 之间可能存在长期的均衡关系,而变量的短期变动则是向着这个长期均衡关系的部分调整。
“误差修正模型”(ErrorCorrectionModel,简记ECM)正是这一思想在计量经济学的体现。
考虑最简单的AR
(1)模型: 44 yt01yt1t 其中,1
1,故yt为平稳过程。
对方程两边求期望, 并令长期均衡值y*E(y)E(y),则可得y*
0。
将 t t
1 1
1 0(11)y*代入原方程,并在方程两边同时减去yt1可得 yt(11)y*(11)yt1tyt(11)(y*yt1)t errorcorrection 这就是AR
(1)的误差修正模型,它将yt表达为对长期均衡的偏离(y*yt1)的部分调整(即误差修正)加上扰动项。
45 一般来说,ADL模型都可以变换成ECM模型。
误差修正模型的优点是,经济含义十分明确,而且可以分别考察长期效应与短期效应。
12.8MA()与滞后算子 MA(q)的自相关函数(ACF)存在截尾。
如果希望其自相关系数永远不为
0,可考虑MA(): yt      j
0 j t  j 其中,0
1。
无穷多个随机变量之和,能收敛到某个随 46 机变量吗? 一个常用的充分条件是,序列j为“绝对值可加总”j
0 (Absolutely Summable,简记
A S ),即  j
0  j (有限)。
在AS的条件下,则MA()有定义。
虽然样本容量T通常有限,而我们也不可能追溯到无穷远的过去,但MA()在理论上仍然有着重要意义。
在时间序列分析中常引入“滞后算子”(lagoperator或backshiftoperator)。
47 定义Lytyt
1,L2ytL(Lyt)yt
2,…,Lpytytp。
特别地,L0yt1ytyt。
滞后算子的运算相当于幂函数。
比如,两个滞后算子相乘满足交换律,其乘积等于指数相加,即LpLq。
Lpq由于ytytyt1(1L)yt,故差分算子1
L。
对于AR(p),yt01yt1pytpt,可以用滞后算子简洁地表示: yt01LytpLpytt 移项可得 48 yt1LytpLpyt0t 向右提取公因子yt (11LpLp)yt0t 定义“滞后多项式”(lagpolynomial)(L)11LpLp: (L)yt0t 上式容易让人产生一种愿望,即如果存在(L)
1,则可以在两边同时左乘(L)
1,从而得到AR(p)的一个“解”。
定义对于任意一个实数序列(
0,1,
2,),定义其对 49 应的“滤波”(filter)为(L)01L2L2。
因此,滤波的实质就是一个(无穷多项)的滞后多项式。
定义对于两个滤波“(L)01L2L2”与“(L)01L2L2”,定义其乘积为 (L)(L)(L)(01L2L2)(01L2L2)00(0110)L(201102)L2 滤波的乘积满足交换律。
我们最感兴趣的情形是(L)
1,即令上式第二行中的 50 常数项00为
1,而其余各项的系数均为
0。
此时,我们称(L)为(L)的“逆”(inverse),并记为(L)
1。
只要0
0,则(L)1都有定义且唯
一,因为可以得到满足(L)(L)1的唯一解(
0,1,
2,),即01
0,110
0,等等。
例(1L)11LL2L3证明:(1L)(1LL2L3)
1。
但(1L)1不再是AS。
例(1L)11L2L23L3证明:只要将上例中的“L”换成“L”即可。
如果
1, 51 则(1L)1为AS。
命题对于yt01yt1t,假设1
1,则此AR
(1) 是MA()。
证明:方法一(迭代法) 52 yt01yt1t01(01yt2t1)t (001)12yt21t1t (001)12(01yt3t2)1t1t 0(1112)13yt312t21t1t  0(1112)t1t112t213t3 023 1t 1t
1 1t
2 1t
3 1 53 方法二(滤波求逆法) 由于(11L)yt0t,故 yt(11L)1(0t) (1L2L2)0(1L2L2)t 0(1112)t1t112t213t3 023 1t 1t
1 1t
2 1t
3 1 可将平稳的AR
(1)看成是过去所有扰动项的总效应之和,且离现在越远的扰动项其影响力呈几何级数递减。
54 从AR
(1)的MA()表达式可以看出 IRF(j)ytjj t
1 ytjt表示的是,当第t期的扰动项t变化1单位时(而 其他期的扰动项均不变),对相隔j期的ytj的影响,被称为“动态乘子”(dynamicmultiplier)。
动态乘子与绝对时间t无关,而是时间间隔j的函数。
将ytjt视为j的函数,则称为“脉冲响应函数” (ImpulseResponseFunction,简记IRF),它刻画的是ytj对t的1单位脉冲(impulse)的响应(response)。
55 将j,ytjt画图,就可以得到对IRF的直观认识。
类似地,AR(p)也是MA()。
将AR(p)“yt01yt1pytpt”写为“(L)yt0t”,如果 (L)1为AS,则 yt(L)10(L)1t 这是MA()的形式。
类似地,更一般的ARMA(p,q)也是MA()。
56 12.9向量自回归过程 我们常常同时关心几个经济变量的预测,比如GDP增长率与失业率。
一种方法是用单变量时间序列的方法对每个变量分别作预测。
另一种方法则是将这些变量放在一起,作为一个系统来预测,以使得预测相互自洽(mutuallyconsistent),这称为“多变量时间序列”(multivariatetimeseries)。
由Sims(1980)所提倡的“向量自回归”(VectorAutoregression,简记VAR)正是这样一种方法。
假设有两个时间序列变量y1t,y2t,分别作为两个回归 方程的被解释变量;而解释变量为这两个变量的p阶滞 57 后值,构成一个二元的VAR(p)系统: y1t1011y1,t11py1,tp11y2,t11py2,tp1ty2t2021y1,t12py1,tp21y2,t12py2,tp2t 其中,1t与2t均为白噪声过程(故不存在自相关),但 允许两个方程的扰动项之间存在“同期相关性”(contemporaneouscorrelation): Cov(1t,2s)102 若ts其他 这两个方程的解释变量一样。
将两个方程写在一起: 58  y1t    10    11  y 1py  y2t20211,t1 2p1,tp    11  y 1py    1t  212,t1 2p2,tp2t 将同期变量写成列向量,并把相应的系数合并为矩阵,  y1t    10    11 y2t2021 11  y1, t
1     1p 21y2,t1 2p 1py1,tp1t 
2 p  y2, t p     2t  记y   y1t ,   1t ,则有 ty2tt2t 59 y   10    11 11 y     
1 p 1py t202121t1 2p2ptpt 
0
1 p 定义相应的系数矩阵为
0,1,,p,可得 yt01yt1pytpt 这个形式与AR(p)很相似,故名“VAR(p)”。
其中,t是一维白噪声过程的推广,称为“向量白噪 声过程”(vectorwhitenoiseprocess)。
60 定义向量白噪声过程t是一个弱平稳的随机过程, 满足以下条件: E(t)
0,E(tt),E(ts)0(ts) 其中,为正定矩阵。
由于不要求为对角矩阵,故向量白噪声过程的各个分量之间可以存在同期相关。
有时也把白噪声过程称为“新息过程”(innovationprocess)。
由于VAR(p)系统中的解释变量yt
1,,ytp依赖于 t
1,t
2,,而t与t
1,t
2,不相关,故可视所有解释 变量为前定变量(predetermined),与当期扰动项t不相关,故可以用OLS对每个方程分别进行估计。
61 在进行VAR建模时,需要确定变量的滞后阶数,以及VAR系统中包含几个变量。
滞后阶数的选择方法之一是使用信息准则,比如AIC或BIC。
方法之二是检验最后一阶系数的显著性(类似于由大到小的序贯t规则)。
在上面的例子中,假设要确定使用VAR(p)还是VAR(p–1),则可以检验原假设“H0:1p2p1p2p0”。
62 方法之三是检验VAR模型的残差是否为白噪声,即是否存在自相关。
如果真实模型为VAR(p),但被错误地设置为Var(p–1),则解释变量的最后一阶滞后ytp被纳入 扰动项t,导致扰动项出现自相关。
更糟糕的是,由于yt 的相关性,包含ytp的扰动项t将与解释变量 yt
1,,yt(p1)相关,导致OLS估计不一致。
为此,需要 检验VAR模型的残差是否存在自相关。
如果存在自相关,则可能意味着应该在解释变量中加入更高阶的滞后变量。
63 VAR变量个数的选择 VAR系统中包含的变量个数越多,则需要估计的系数越多。
假设有5个变量,滞后4期,则每个方程中共有21个待估系数(含截距项),而整个VAR系统共有105个待估系数!待估系数过多将使得样本容量过小,增大估计误差,降低预测精度。
因此,VAR模型通常仅包含为数不多的几个变量。
在设定VAR模型是,主要应根据经济理论来确定哪些变量应在VAR模型中。
比如,经济理论告诉我们,通货膨胀率、失业率、短期利息率互相关联,可以构成一个三变量的VAR模型。
64 也可以在VAR系统中引入其他外生变量,比如 z1t,z2t,,zKt,与扰动项不相关。
12.10VAR的脉冲响应函数由于VAR模型包含许多参数,而这些参数的经济意义 很难解释,故将注意力集中于脉冲响应函数。
正如AR
(1)可写为MA(),对于VAR(p)系统“yt01yt1pytpt”,可写成VMA()的形式: 65 yt  t 1t
1 2t
2     i
0 i t i 其中,0In,而j为n维方阵。
可以证明, ytsts 其中,ytst为n维列向量yts对n维行向量t求偏导 数,故得到nn矩阵s。
矩阵s是一维情形下相隔s期的动态乘子向多维的推 广,其第i行、第j列元素等于yi,tsjt。
它表示的是, 当第j个变量在第t期的扰动项jt增加1单位时(而其他 66 变量与其他期的扰动项均不变),对第i个变量在第(ts)期的取值yi,ts的影响。
将yi,tsjt视为时间间隔s的函数,就是“脉冲响应函 数”(IRF)。
脉冲响应函数的缺点是,它假定在计算yi,tsjt时, 只让jt变动,而所有其他同期扰动项均不变。
此假定只有当扰动项的协方差矩阵E(tt)为对角矩阵时才成立(即同期扰动项之间正交);否则,当jt变动时,必然伴随着其他方程的同期扰动项发生相应的变动。
67 为此,考虑“正交化的脉冲响应函数”(OrthogonalizedImpulseResponseFunction,简记OIRF),即从扰动项t中分离出相互正交的部分,记为vt,然后计算当vt中的某个分量变动时,对各变量在不同时期的影响。
可以证明,对任何对称正定矩阵nn均可进行以下“乔利斯基分解”(Choleskyposition): PP 其中,P为下三角矩阵,主对角线元素全部为正数,而且P唯
一。
定义正交化的扰动项为 68 vtP1εt 则新扰动项vt的协方差矩阵为单位矩阵: E(vv)E(P1P1)P1E()P1 tt tt tt P1P1P1PPP1
I 新扰动项vt各分量正交,且方差均被标准化为1;故新扰动项vt的一个分量变化一单位,也就是变化一个标准差。
利用乔利斯基分解,将VAR模型的VMA表示法写为: 69 yt     i
0 i t i  i0iPP-1ti=   i
0 Φi vt i 其中,ΦiiP。
可以证明, ytsΦvs t 其中,矩阵Φs的第i行、第j列元素等于yi,tsvjt,即 正交化的脉冲响应函数(OIRF)。
然而,正交化的脉冲响应函数依然有缺点。
首先,正交化冲击(orthogonalizedshocks)vt的经济含义不易解释。
其次,由于乔利斯基分解所用矩阵P为下三角矩阵,故 70 正交化的脉冲响应函数依赖于变量的次序(orderofvariables);如果改变变量次序,则可能得到很不相同的结果。
OIRF虽然使得因果关系更清楚,但代价是需要对变量起作用的次序作较强的先验假设,而经济理论通常无法对变量次序给出明确的指南。
在实践中,可借助借助格兰杰因果检验来确定两个变量之间的排序,参见下文。
在难以确定变量次序的情况 71 下,为了稳健起见,对于不同的变量排序,分别画其正交化脉冲响应图,然后进行比较。
如果不同变量排序的OIRF差别不大,则结果较可信;反之,则值得怀疑。
12.11格兰杰因果检验经济学中常常需要确定因果关系究竟是从x到y,还 是从y到x,抑或双向因果关系。
格兰杰[Granger(1969)]提出的检验方法基于以下思想。
如果x是y的因,但y不是x的因,则x的过去值可以帮助预测y的未来值,但y的过去值却不能帮助预测x的未来值。
72 考虑以下时间序列模型:① yt    p m
1 m yt m   pm
1  m xt m t 其中,滞后阶数p可根据“信息准则”或“由大到小的序贯t规则”来确定。
检验原假设“H0:1p0”,即x的过去值对预测y的未来值没有帮助。
如果拒绝H0,则称x是y的“格兰杰因”(Grangercause)。
将以上回归模型中x与y的位置互换,则可以检验y是否为x的格兰杰因。
73 在实际操作中,常将(x,y)构成一个二元VAR系统,然后在VAR的框架使用Stata命令vargranger进行格兰杰因果检验。
也可使用非官方命令gcause,下载方法为“sscinstallgcause”。
格兰杰因果关系并非真正意义上的因果关系。
它充其量只是一种动态相关关系,表明的是一个变量是否对另一变量有“预测能力”(predictability)。
从某种意义上来说,它顶多是因果关系的必要条件。
格兰杰因果关系也可能由第三个变量所引起。
74 格兰杰因果检验仅适用于平稳序列,或者有协整关系的单位根过程。
对于不存在协整关系的单位根变量,则只能先差分,得到平稳序列后再进行格兰杰因果检验。
12.12VAR的Stata命令及实例与VAR相关的Stata命令包括(假设变量为x,y,z) varsocxyz,maxlag(#)此命令用来计算不同滞后期的信息准则,其中“soc”表示“Selection-OrderCriteria”,选择项“maxlag(#)”表示最大滞后期,默认值为
4。
在未使用选择项 75 “maxlag(#)”的情况下,如果恰好选择最优滞后4期,则应通过选择项“maxlag(#)增加最大滞后期数。
varbasicxyz,lags(numlist)irffevd 这是估计VAR模型的便捷命令。
选择项“lags(numlist)”表示滞后阶数,默认为“lags(1 2)”,即滞后二阶。
选择项“irf”表示画(未正交化)脉冲响应图,选择项“fevd”表示画预测方差分解图,默认为“oirf”(画正交化脉冲响应图)。
估计VAR的正式命令为 76 varxyz,lags(numlist)exog(w1w2) 其中,选择项“lags(numlist)”表示滞后阶数,默认为“lags(12)”,即滞后二阶。
选择项“exog(w1w2)”表示在VAR模型中引入外生变量w1,w2。
varlmar估计VAR后,对残差是否存在自相关进行LM检验。
varstable,graph估计VAR后,通过特征值检验该VAR系统是否为平稳过程。
如果所有特征值都在单位圆内部,则为平稳过 77 程,参见第13章。
选择项“graph”表示画出特征值的几何分布图。
varwle估计VAR后,对每个方程以及所有方程的各阶系数的联合显著性进行Wald检验,其中“wle”表示Waldlag-exclusionstatistics。
vargranger估计VAR后,进行格兰杰因果检验。
irfcreateirfname,set(filename)step(#)replaceorder(varlist) 78 估计VAR后,将有关脉冲响应的结果存为“irfname”(可自行命名)。
选择项“set(filename)”表示建立脉冲文件“filename”,使之成为当前的脉冲文件(makefilenameactive),并将脉冲结果“irfname”存入此脉冲文件“filename”(若未使用选择项“set(filename)”指定脉冲文件,则将脉冲响应结果存入当前的脉冲文件);选择项“step(#)”表示考察#期的脉冲响应函数,默认值为“step
(8)”;选择项“replace”表示替代已有的同名脉冲响应结果irfname(如果有)。
一个脉冲文件“filename”可存储多个脉冲响应结果“irfname”。
79 选择项“order(varlist)”指定变量排序,默认使用估计VAR时的变量排序计算正交化IRF。
irf graph response(varname) irf,impulse(varname) 画脉冲响应图(未正交化)。
其中,选择项“impulse(varname)”用于指定脉冲变量,而选择项“response(varname)”用来指定反应变量,默认画 出所有变量的脉冲响应图。
irf graph response(varname) oirf,impulse(varname) 80 画正交化的脉冲响应图 如
果将以上命令中的“irfgraph”改为“irftable”,则将相应信息列表而非画图。
puteprefix,step(#) 估计VAR后,计算被解释变量未来#期的预测值,并把预测值赋予被解释变量加上前缀“prefix”(自行确定)的变量名。
fcastgraphvarlist,observed 81 运行命令“pute”后,将变量“varlist”的预测值画图,其中选择项“observed”表示与实际观测值相比较。
下面以数据集“macro_swatson.dta”为例,进行VAR估计。
该数据集包含了1960-2002年美国宏观经济的以下季度变量:inf为通货膨胀率,dinf为通货膨胀率的一阶差分,unem为失业率,quarter为季度。
由于通胀率inf可能不平稳(参见第13章),故考虑其一阶差分dinf与失业率unem所构成的二元VAR系统。
82 首先,根据信息准则,估计此VAR系统的阶数。
.usemacro_swatson.dta,clear .varsocdinfunem Selection-ordercriteriaSample:1961q4-2002q1 Numberofobs = 162 lag LL LR dfp FPE AIC HQIC SBIC 0881.581 6.6e-08-10.859-10.8435-10.8209
1 1141.4519.6340.0002.8e-09-14.0172-13.9708-13.9029 21213.86144.93*40.0001.2e-09*-14.8625*-14.7851*-14.6719* 31217.326.922440.1401.2e-09-14.8558-14.7475-14.589 41219.454.253740.3731.2e-09-14.8327-14.6934-14.4896 Endogenous:dinfunemExogenous:_cons 结果显示,当p=2时(上表中打星号者),AIC与 BIC信息准则最小化。
83 其次,估计二阶向量自回归模型:.vardinfunem,lags(1/2) 84 Vectorautoregression Sample:1961q2-2002q1 Loglikelihood=1224.456 FPE =1.27e-09 Det(Sigma_ml)=1.12e-09 Equation Parms RMSE dinfunem
5 .013815
5 .002508 R-sq 0.36210.9731 No.ofobsAICHQICSBIC chi2 P>chi2 93.110475926.554 0.00000.0000 = 164 =-14.81044 =-14.73371 =-14.62143 dinfunem dinfL1.L2. unemL1.L2. _cons dinfL1.L2. unemL1.L2. _cons Coef.Std.Err. zP>|z| -.4709436-.401031 -2.242052.03417 .0123764 .0676118.0654944 .3371897.3356694.0045265 -6.97-6.12 -6.656.062.73 0.0000.000 0.0000.0000.006 .0305223-.0113172 1.638031-.6725807 .0020139 .0122746.0118902 .0612152.0609392.0008218 2.49-0.95 26.76-11.04 2.45 0.0130.341 0.0000.0000.014 [95%Conf.Interval] -.6034603-.5293976 -2.902931.37627 .0035047 -.338427-.2726644 -1.581172.69207 .0212482 .0064645-.0346216 1.518051-.7920194 .0004032 .05458.0119871 1.75801-.5531421 .0036245 85 上表显示,大多数的系数均很显著。
下面检验各阶系 数的联合显著性。
.varwle Equation:dinf lag chi2 dfProb>chi2 172.72164
2 0.000
2 72.9294
2 0.000 Equation:unem lag chi2 1741.89162123.1287 dfProb>chi2
2 0.000
2 0.000 Equation:All lag chi2 1796.24182187.9991 dfProb>chi2
4 0.000
4 0.000 86 无论是单一方程,还是两个方程作为整体,各阶系数 均高度显著。
下面检验残差是否为白噪声,即残差是否存在自相关。
.varlmar Lagrange-multipliertest lag chi2dfProb>chi2
1 7.3130
4 0.12024
2 5.0645
4 0.28074 H0:noautocorrelationatlagorder 结果显示,可以接受残差“无自相关”的原假设。
进一步检验此估计出来的VAR系统是否为平稳过程。
87 .varstable,graph Eigenvaluestabilitycondition Eigenvalue Modulus .82182.7970223-.2258777+-.2258777- .6292178i.6292178i .82182.797022.668533.668533 Alltheeigenvalueslieinsidetheunitcircle.VARsatisfiesstabilitycondition. 88 Rootsofpanionmatrix
1 .5
0 Imaginary -.5 -
1 -
1 -.5
0 .5
1 Real 上表与上图显示,此VAR系统是稳定的。
89 下面考察变量dinf与unem之间的格兰杰因果关系。
.vargranger GrangercausalityWaldtests Equation Excluded chi2 dfProb>chi2 dinfdinf unemALL 48.12348.123 20.00020.000 unemunem dinfALL 9.0099.009 20.01120.011 无论以dinf还是unem为被解释变量,其p值均远小于0.05。
因此,二者互为格兰杰原因。
故格兰杰因果检验无法提供变量排序的信息。
90 下面考察正交化脉冲响应函数,将脉冲文件命名为“macro”,将脉冲结果命令为“iu”(表示变量排序为dinf,unem)。
.irfcreateiu,set(macro)replace(filemacro.irfcreated)(filemacro.irfnowactive)irfnameiunotfoundinmacro.irf(filemacro.irfupdated) .irfgraphoirf 91 iu,dinf,dinf.02 iu,dinf,unem .01
0 -.01 iu,unem,dinf.02 iu,unem,unem .01
0 -.01
0 2
4 6 80
2 4
6 8 step 95%CI orthogonalizedirf Graphsbyirfname,impulsevariable,andresponsevariable 92 下面变换变量次序,考察正交化脉冲响应函数的稳健性。
.irfcreateui,order(unemdinf)(filemacro.irfupdated) 比较在两种变量排序下,dinf对unem的脉冲响应。
.irfgraphoirf,i(unem)r(dinf) 93 iu,unem,dinf0 ui,unem,dinf -.005 -.01
0 2
4 6 80
2 4
6 8 step 95%CI orthogonalizedirf Graphsbyirfname,impulsevariable,andresponsevariable 94 从上图可知,变量排序对(unemdinf)的正交化脉冲响应影响不大。
进一步比较在两种变量排序下,unem对dinf的脉冲响应。
.irfgraphoirf,i(dinf)r(unem) 95 iu,dinf,unem.001 ui,dinf,unem
0 -.001
0 2
4 6 80
2 4
6 8 step 95%CI orthogonalizedirf Graphsbyirfname,impulsevariable,andresponsevariable 变量排序对(dinfunem)的正交化脉冲响应幅度 96 有较大影响。
估计VAR模型后,可以用它进行预测。
假设我们仅用 1999年以前的数据来估计VAR模型,然后预测1999年1季度-2002年1季度的10个季度,并与实际观测值比较。
.varbasicdinfunemifquarter 97 Vectorautoregression Sample:1961q2-1998q4 Loglikelihood=1118.534 FPE =1.44e-09 Det(Sigma_ml)=1.26e-09 Equation Parms RMSE dinfunem
5 .014258
5 .002585 R-sq 0.36730.9705 No.ofobsAICHQICSBIC chi2 P>chi2 87.651654971.522 0.00000.0000 = 151 =-14.68256 =-14.60139 =-14.48274 dinfunem dinfL1.L2. unemL1.L2. _cons dinfL1.L2. unemL1.L2. _cons Coef.Std.Err. zP>|z| -.4718995-.4066509 -2.2798012.050438.0139506 .0702018.0682215 .3502631.3471149 .005028 -6.72-5.96 -6.515.912.77 0.0000.000 0.0000.0000.006 .0302607-.0120022 1.636296-.6760615 .0023965 .012728.012369 .0635048.062934 .0009116 2.38-0.97 25.77-10.74 2.63 0.0170.332 0.0000.0000.009 [95%Conf.Interval] -.6094925-.5403626 -2.9663041.370105.0040959 -.3343064-.2729393 -1.5932982.730771.0238053 .0053143-.0362449 1.511829-.7994099 .0006098 .0552072.0122405 1.760763-.5527131 .0041832 98 上表显示,子样本的样本容量减少为151。
下面,预测未来10个季度的变量取值,分别记为“f_dinf”与“f_unem”,然后画图。
.putef_,step(10).fcastgraphf_dinff_unem,observedlpattern("_") 99 Forecastfordinf Forecastforunem .08 .04 .02 .06
0 .04 -.02 .02 -.04 1998q3 1999q3 2000q3 2001q31998q3 95%CIobserved 1999q3 forecast 2000q3 2001q3 100 其中,选择项“observed”表示显示变量的实际观测值,选择项“lpattern("_")”表示以虚线来表示变量的预测值(以便区别于实际观测值)。
上图似乎表明,对通胀率变动的预测准确度优于对失业率的预测(但须注意二者的纵坐标单位与绝对位置都不同),而二者的实际观测值均落在预测值95%的置信区间内。
另外,可以看出,预测的时期越长,则预测的精确度越低。
101 12.13季节调整
1.季节效应 对于月度或季度时间序列,常常需要对其进行“季节调整”(seasonaladjustment),去掉“季节效应”后才能使用。
比如,考察中国的季度GDP数据。
由于第一季度包含春节,故通常第一季度的GDP偏低。
如果直接以第二季度GDP除以第一季度GDP来计算环比增长率,则会高估第二季度的GDP增长率;同样道理,将 102 第一季度GDP除以上年第四季度GDP则会低估第一季度的GDP增长率。
总之,包含季节效应的时间序列不能直接计算环.比.增长率。
如果不进行季节调整,则只能计算同.比.增长率,即与去年同一季(月)相比。
年度数据不需要进行季节调整。
可能导致季节效应的因素包括:
(1)天气因素:比如,在冬季由于取暖而增加能源消 耗。
103
(2)行政因素:比如,学校开学与放假的日期对交通量的影响。

(3)固定假日:比如,十一国庆节对旅游与交通的影响。

(4)移动假日(movingholiday):比如,春节期间,铁路运输量增加而GDP下降。

(5)日历因素:比如,闰年与闰月的影响。

(6)交易日效应:比如,五金店销售额在有五个周末 104 的月份高于只有四个周末的月份。
所有这些季节因素共同构成一个时间序列的“季节 要素”(ponent)。
该时间序列的长期走势与中期周期被称为“趋势循环要素”(trendponent),有时简称“趋势要素”(ponent)。
其他不可预测的随机扰动则为该序列的“不规则要素”(ponent)。

2.季节调整的原理 105 季节调整通常通过估计“季节因子”(seasonalfactor)来进行。
根据季节因子起作用的方式,季节因子主要分 为两种,即“加法季节因子”(additiveseasonalfactor) 与“乘法季节因子”(multiplicativeseasonalfactor)。
“加法季节因子”意味着对所有第1月(或第1季)加.上.相同 的季节因子,以此类推。
“加法模型”(additivemodel)的数学表达式如下: YtTCtStIt (20.1) 106 其中,Y为原序列,TC为趋势循环要素,S为季节要 t t t 素,而It为不规则要素。
另一方面,“乘法季节因子”则意味着对所有第1月(或第1季)乘.以.相同的季节因子, 以此类推。
“乘法模型”(multiplicativemodel)的数学表达式如下: YtTCtStIt (20.2) 使用乘法模型要求Y序列中不包含零或负数。
对方程t (20.2)两边同时取对数可得: 107 lnYtlnTCtlnStlnIt(20.3)方程(20.3)在形式上与加法模型相同,故称为“对数加法模型”。
季节调整的目标就是将原序列Y分解为趋势循 t 环要素、季节要素与不规则要素,然后去掉季节要素St,得到季节调整序列(seasonallyadjustedseries)。
季节调整的具体方法有多种,使用不同方法,会得到不同的季节调整序列,带有一定的主观性;这是季节调整的局限性。
因此,国外的统计部门一般同时公布原序列与季节调整 108 序列。

3.回归法回归法的基本步骤为,首先生成月度(或季度)虚拟变 量,然后把时间序列对这些虚拟变量进行OLS回归,所得到的残差就是经季节调整后的序列。
下面以turksales.dta为例,该数据集包括1990年第1季至1999年第4季的火鸡销售额(sales)与时间变量(t)。
首先看一下火鸡销售额的时间趋势。
109 .useturksales.dta,clear.tslinesales 115 110 105 sales 100 95 1990q1 1992q3 1995q1t 1997q3 2000q1 从上图可知,火鸡销售额有时明显的季节波动。
其中,第四季度的火鸡销售最好,因为感恩节在第四季度,而火鸡是感恩节的传统食物;第一与第二季度的销售较为 110 平淡。
为了生成季度虚拟变量,首先从时间变量t中提取季 度信息,记为变量quarter。
.genquarter=quarter((dofq(t))) 其次,使用命令tab来生成季度虚拟变量。
.tabquarter,gen(q) quarter Freq. Percent Cum.
1 10 25.00 25.00
2 10 25.00 50.00
3 10 25.00 75.00
4 10 25.00 100.00 Total 40 100.00 然后,以第
1季度为参照值,把变量sales对常数项以 111 及第2-4季度虚拟变量进行回归。
.regsalesq2-q4 Source ModelResidual Total SS 161.370376480.52796 641.898336 df MS 353.79012543613.3479989 3916.4589317 Numberofobs= F(3,36)= Prob>
F = R-squared = AdjR-squared= RootMSE = 404.030.01430.25140.18903.6535 sales q2q3q4_cons Coef. 2.3892944.33511 5.232047102.6287 Std.Err. 1.6338911.6338911.6338911.155335 t 1.462.653.2088.83 P>|t| 0.1520.0120.0030.000 [95%Conf.Interval] -.92439081.0214251.918362100.2856 5.7029787.6487948.545731104.9719 上表中的F统计量的p值为0.0143,这个回归方程高度显著。
而且R20.25,表明季度虚拟变量对于变量sales有较强的解释力。
为了获得经季度调整的序列,下 112 面使用命令predict来获得上述回归的残差项(记为 sales_sa)。
.predictsales_sa,r然而,OLS残差项的平均值一定为
0,故需要把原 序列的均值加回去,并记季节调整序列为 sales_sa_reg。
.sumsales Variable Obs MeanStd.Dev. Min Max sales 40105.61784.05696197.84603112.9617 .gensales_sa_reg=sales_sa+r(mean) 113 下面,将回归法的季节调整序列与原序列画图。
.tslinesales_sa_regsales,lpattern("_") 115 110 105 100 95 1990q1 1992q3 1995q1t sales_sa_reg 1997q3sales 2000q1 经回归法进行季节调整后,序列变得更为光滑,季节性波动的特征已不太明显。
114

标签: #communication #chess #cdi #货车 #系统 #ciass #什么意思 #care