非线性经济时间序列建模
上QQ阅读APP看书,第一时间看更新

3.6 人工神经网络模型

对包括经济在内的不同的过程和现象进行建模时,使用人工神经网络(ANN)模型已经受到青睐,非常受欢迎。神经网络运用最成功的是在如下领域:存在很多的可输入变量,并且在对输出的影响上,这些可输入变量没有任何一个处于优先位置。很多分类问题属于这个类别,比如模式分类,包括图像分类和声音识别。包括这些模型的历史背景的更多讨论,可参阅Fine(1999,第1章)或Hayki(1999,第1.9节)的文献。ANN模型在时间序列计量经济学中的运用,特别是经济预测方面,总的来说还不是相当成功,例如,可以参阅Stock和Watson(1999)、Marcellino(2004)和Teräsvirta、van Dijk和Medeiros(2005)对宏观经济计量的大量研究。成功的例子是:Kuan和Liu(1995)用ANN模型预测了日汇率,且相对于简单随机游走模型,他们的样本外预测报告了更小的均方根预测误差。还有,Kuan和White(1994)从计量经济学的角度对ANN模型进行了有用的评论。

ANN模型之所以值得众多实践者的深入思考,是因为它们受到了来自统计和神经网络方面文献的关注。把对时间序列建模和处理作为研究的重点限制到最简单的单方程式情形,即所谓的单一“隐藏层”模型。这种模型的形式表达式为

068-01

其中,yt是输出序列,zt=(1,yt-1,…,yt-p,x1t,…,xkt)′是输入向量,包含截距和输出序列的滞后值,β0zt是一个线性单位,β0=(β0001,…,β0,p+k)′。此外,在神经网络文献中,把βj(j=1,…,q是参数)称为“连接强度”。函数G(·)是有界的渐近常数函数,称之为“挤压函数”,γj(j=1,…,q)是参数向量。典型的挤压函数是单调递增的,诸如逻辑函数和双曲正切函数。通常假定误差项{εt}~iid(0,σ2)。很多神经网络模型假定β000,其中,称β00为“偏差”,但是在时间序列运用中,省略这个线性单位可能并不总是合理的。“隐层”这个术语指的是式(3-23)的结构。尽管输出yt和输入向量zt可观测,但线性组合068-02不可观测。因此,在“输出层”yt和“输入层”zt之间形成了一个隐层。

诱发广泛应用ANN模型的理论观点认为,ANN模型是万能逼近器。假定yt=H(zt),也就是说,在y和z之间存在函数关系。然后,在H的温和正则性条件下,存在正整数q≤q0<∞,使得对于任意的δ>0,|H(z)-069-01|<δ成立,其中|·|为适合的范数。这个结果的重要性在于q是有限的事实,所以,任一未知函数H都可用挤压函数G(γjz)的线性组合进行任意的精确近似。一些论文对此进行了讨论,包括Cybenko(1989)、Funahashi(1989)、Hornik、Stichcombe、White(1989)和White(1990)的讨论。

能够把人工神经网络模型式(3-23)从其他非线性计量经济学模型中分离出来的统计学性质在于,人工神经网络模型仅仅是局部可识别。从式(3-23)可以看出,隐藏单元是可以交换的。比如,令任意(βi,γ′i)′和(βj,γ′j)′,i≠j,方程中交换的位置并不影响似然函数的值。因此,对于q>1,总存在着多于一个的可观测的等效参数化,所以,对整体识别而言,需要对参数施加约束。例如,可假定β1≤…≤βq。此外,如果挤压函数是奇函数,比如,逻辑函数,那么

Gγjzt)=(1+exp{-γjzt})-1=1-G(-γjzt

并且两个参数化都是等效可观测的。对于识别性,将不得不在它们之间选择。例如,Hwang和Ding(1997)讨论了ANN模型的识别条件。在证明ANN模型的最大似然或最小二乘估计量具有一致性和渐近正态性时,可识别性必不可少,这是因为证明过程需要唯一最优条件的存在。

为了简单起见,假定在式(3-23)中,zt=wt=(1,yt-1,…,yt-p)′,并且假设{εt}~iid(0,σ2)。{yt}为弱平稳的充分必要条件简化为069-02, |z|≤1。因此,线性自回归模型和自回归ANN模型有相同的平稳条件。直观地说,这是由于具有有限系数的隐单元是有界的这一事实,而且在模型中并没有引进非平稳行为。换个角度讲,自回归ANN模型是具有时变截距的自回归模型

069-03

的一个例子,其中,069-04可以把第3.2节中提到的式(3-7)的转换截距TAR模型看作式(3-24)所示模型的特例。

第16.5节将讨论为经济时间序列建立ANN模型。