关于ARMA-BP神经网络组合模型的财政收入预测


扩展功能
	加入收藏夹

	复制引文信息

	加入引用管理器

	Email Alert

	RSS
本文作者相关文章
	方博

	何朗

方博, 何朗

武汉理工大学理学院, 湖北武汉 430070

收稿日期：2014-05-11; 接收日期：2014-09-08

基金项目：湖北省科技支撑计划软科学研究类项目(2014BDH118)

作者简介：方博(1989-), 男, 湖北黄冈, 硕士, 主要研究方向:金融数学与数量经济分析

摘要：本文研究了ARMA-BP神经网络组合模型预测的问题.利用最大最小贴近度评价方法, 获得了ARMA-BP神经网络组合模型对应的贴近度差值大于单一模型的结果, 推广了组合模型比单一模型预测精度更优的结果.

关键词：ARMA模型 BP神经网络组合模型最大最小贴近度

FISCAL REVENCE PREDICTION ABOUT THE ARMA-BP NEURAL NETWORK COMBINATION MODEL

FANG Bo, HE Lang

College of Science, Wuhan University of Technology, Wuhan 430070, China

Abstract: This paper studies the prediction of ARMA-BP neural network combination model. Using the evaluation method of maximum-minimum degree, we get the result that the degree of difierence of ARMA-BP neural network combination model is greater than the single model, which generalizes the conclusion that the combination model is superior to the single model on prediction precision.

Key words: ARMA model BP neural network combination model maximum-minimum degree

1 引言

财政收入是衡量一国政府财力的重要指标, 对财政收入的预测一直都是学者们研究的热点.目前较为常用的预测方法有神经网络、灰色理论和时间序列分析等.然而, 单一预测模型的优缺点十分突出, 它们都有一定的局限性.

近年来, 有学者尝试运用组合模型来实现预测.如赖红松等人运用灰色神经网络组合模型对人口数量进行了预测, 并获得了更为精确的预测效果^[1]; 刘明凤等人采用卡尔曼滤波方法将ARMA模型和BP相结合, 提出了一种改进的卡尔曼滤波混合预测模型, 该模型的预测误差大大减小, 预测结果的延迟现象也得到改善^[2].

以上两种组合模型有效的发挥了单一模型的长处, 同时避免了单一模型的缺陷.本文尝试选取ARMA模型和BP神经网络, 依据组合预测思想, 构建一个更为有效的财政收入组合预测模型, 然后对组合模型的预测结果进行检验, 以论证组合模型相对于单一模型的预测精确性.

2 组合模型的构建

2.1 ARMA模型

ARMA(p, q)模型简称自回归滑动平均模型, 它由自回归和移动平均两部分构成, 其中p, q分别表示自回归和移动平均部分的阶数, 其一般表达式为

$ \left\{ \begin{array}{l} {x_t} = c + {\phi _1} \cdot {x_{t - 1}} + \cdots + {\phi _p} \cdot {x_{t - p}} + {\varepsilon _t} - {\theta _1} \cdot {\varepsilon _{t - 1}} - \cdots - {\theta _q} \cdot {\varepsilon _{t - q}},\\ {\varepsilon _t} ～ WN(0,{\sigma ^2}),\forall s < t,E({x_s},{\varepsilon _t}) = 0, \end{array} \right. $

(2.1)

其中$ \phi_{1}, \cdots, \phi_{p}$为自回归系数, $\theta_{1}, \cdots, \theta_{q}$为移动平均系数, $\{\varepsilon\}$是白噪声序列^[3].

2.2 BP神经网络

BP神经网络, 简称误差反向传播神经网络.它由一个输入层、一个或多个隐含层和一个输出层构成, 而每一层则由一些神经元构成, 相邻层各个神经元之间形成完全连接关系, 且同一层内各个神经元之间形成完全不连接关系. $n$个输入信号从输入层进入网络, 经激励函数变换后到达隐层, 再经激励函数变换到达输出层构成$m$个输出信号^[4].

在神经网络模型中, 输出$y_{t}$和输入$y_{t-1}, y_{t-2}, \cdots $之间的关系如下:

$ \begin{equation} y_t=\omega_0+\sum\limits_{j=1}^n \omega_j \cdot f(\omega_{0j}+\sum\limits_{i=1}^m \omega_{ij}\cdot y_{t-i})+\varepsilon_t. \end{equation} $

(2.2)

上式中$ \omega_{ij} (i=1, 2, \cdots, m;j=1, 2, \cdots, n)$是模型的参数, $m$是输入层的节点数, $n$是隐含层节点数^[5].

2.3 ARMA-BP神经网络组合模型

对于一组给定的时间序列$y_{t}$, 现把它分解为线性自相关结构$L_{t}$和非线性残差结构$N_{t} $两部分, 即$y_{t}=L_{t}+N_{t}$.首先, 用ARMA模型对$y_{t}$进行预测, 那么原始序列与ARMA模型预测结果之差为$e_{t}=y_{t}-\hat{L}_{t}$, 显然残差序列$\{e_{t} \}$包含了原始序列中的非线性关系; 接着运用BP神经网络对残差序列$\{e_{t} \}$进行预测, 预测结果为$ \hat{N}_{t}$, 同样$ \hat{N}_{t}$包含了原始序列中的非线性关系; 最后把两种模型的预测结果相加, 就得到了组合模型的最终预测结果$\hat{y} _{t}$, $\hat{y} _{t}=\hat{N}_{t}+\hat{L}_{t}$^[6].

不难看出, 利用ARMA模型的线性拟合能力以及BP神经网络的非线性映射能力, 把它们分别应用于原始序列线性和非线性关系的预测, 通过对这两个模型的综合运用, 充分发挥了它们各自的长处, 避免了单一预测模型的不足之处, 从而达到了取长补短、相辅相成的目的.

3 最大最小贴近度评价法

令$\hat{x}_{i}\{t\}$表示第$i$个预测模型在$t$时刻的预测值, $x\{t\}$表示t时刻的实际值, 那么称$ a_{i}(t)=\frac{|x\{t\}-\hat{x}_{i}\{t\}|}{x\{t\}} $为第$i$个预测模型在$t$时刻的预测精度, 且称$a_{i}(t)=(a_{i}(1), a_{i}(2), \cdots, a_{i}(n))$为第i个预测模型的预测精度向量$(i=1, 2, \cdots, m)$.令$\bar{a}(t) =\min\{a_{1}(t), a_{2}(t), \cdots, a_{m}(t)\}, $ $ \underline{a}(t)=\max\{a_{1}(t), a_{2}(t), \cdots , a_{m}(t)\}$分别为$m$个预测模型在$t$时刻预测精度的最小最大值, 这些值就构成了最优精度向量$\bar{a} =(\bar{a}(1), \bar{a}(2), \cdots, \bar{a}(n)\ )$和最劣精度向量$ \underline{a}=(\underline{a}(1), \underline{a}(2), \cdots, \underline{a}(n)\ )$^[7-8].若预测模型越接近最优精度向量, 则说明该模型的预测精度越高; 同理, 若预测模型越接近最劣精度向量, 则说明该模型的预测精度越低.

为了度量预测模型与精度向量的相近程度, 现引用最大最小贴近度理论:

引理 1.1 对于任意两个向量$X=(X_{1} , \cdots, X_{n})$和$Y=(Y_{1}, \cdots, Y_{n})$, 令

$ \Gamma(X, Y)=\frac{\sum\limits_{t=1}^n (X_t\bigwedge Y_t)\cdot \sum\limits_{t=1}^n \{\min(X_t, Y_t)\}}{\sum\limits_{t=1}^n (X_t\bigvee Y_t)\cdot \sum\limits_{t=1}^n \{\max(X_t, Y_t)\}}, $

(3.1)

称$\Gamma(X, Y)$为向量$X$和$Y$的最大最小贴近度^[9].显然, $\Gamma(X, Y)$越大, 向量$X$和$Y$就越接近.这样就可以计算出每个预测模型对应的精度向量与最优最劣精度向量之间的贴近度, 从而只需比较贴近度差值$ \Gamma(a_{i})=\Gamma(\bar{a}, a_{i})-\Gamma(\underline{a}, a_{i})$的大小就可以判定对应预测模型的优劣.

4 实证分析

文章选取1950-2012年我国财政收入年度数据作为样本对上述模型进行实证分析, 数据来源于中国统计年鉴.

4.1 ARMA模型实证分析

运用Eviews6.0软件首先对原始数据取对数后的序列X进行平稳性检验, ADF检验值为-6.02, 而$1\% $置信水平下的$t$检验值为-3.67, 前者绝对值大于后者绝对值, 说明序列$X$平稳, 可以进行ARMA模型拟合.然后分别对不同的ARMA$(p, q)$模型进行AIC检验、DW检验和$t$检验.设定检验标准: AIC值越小越好, DW值接近于2, $t$检验值可信度大于$99\% $.比较不同的检验值, 发现ARMA$(2, 1)$模型的各项指标最优.此时, AIC值为-2.97, DW值为1.83, $t$检验值分别为$99.86\% $、$99.99\% $和$99.99\% $, 均大于$99\% $, 故选用ARMA(2, 1) 模型预测财政收入.采用非线性最小二乘法(NLS)估计ARMA(2, 1) 模型的参数, 结果如图 1所示:

图 1 ARMA(2, 1) 模型参数估计

由图 1可知对序列$X$拟合的函数表达式^[10]为

$ X_{t}=0.323667X_{t-1}+0.700571X_{t-2}+\varepsilon_{t}+0.969481\varepsilon_{t-1}. $

(4.1)

4.2 BP神经网络实证分析^[12]

把序列X与ARMA模型预测结果相减就得到了残差序列$\{e_{t}\}$, 在Matlab R2010a软件上利用BP神经网络对该残差序列进行拟合.神经网络输入层和输出层的神经元个数分别为5和1, 神经网络的总样本量为61, 把1952-2000年的样本作为训练集, 2001-2012年的样本作为测试集, 采用单隐层的BP神经网络(5-14-1), 即隐含层神经元个数为14^[11]. BP网络参数设置为:系统精度为0.0001, 最大训练次数为10000, 步长为0.01.经过6082次训练, 结果如图 2所示.

图 2 BP神经网络训练结果

4.3 组合模型实证分析

把ARMA模型的预测结果与BP神经网络的预测结果相加, 就得到了ARMA-BP神经网络组合模型的最终预测结果. 表 1给出了2001-2012年财政收入对应的ARMA模型、BP神经网络和组合模型预测结果.

表 1 三种模型的预测值与真实值比较(单位:亿元)

4.4 贴近度的计算与结果分析

根据表 1的预测结果, 运用公式(3.1) 计算出ARMA模型、BP神经网络以及ARMA-BP神经网络组合模型对应的精度向量与最优最劣精度向量的贴近度差值分别为: $\Gamma (a_{1})=-0.908591$, $\Gamma (a_{2})=0.405035$, $\Gamma (a_{3})=0.820389$.由于$\Gamma (a_{3})>\Gamma (a_{2})>\Gamma (a_{1})$, 可以认为ARMA-BP神经网络组合模型是预测财政收入的有效方法, 它的预测精度优于单一的ARMA模型和BP神经网络, 而BP神经网络的预测精度优于ARMA模型.

由于组合预测的思想方法具有一定的普适性, 该结果对其它领域的预测研究具有一定的借鉴意义, 我们可以尝试构建基于灰色理论、神经网络、时间序列和回归分析等不同预测方法的组合模型并对其进行深入研究.另外, 贴近度法是一种比较新颖的评价方法, 它针对不同的预测模型, 利用贴近度理论把预测结果定量化, 这使得模型的评价问题变得简单明了.

5 结论

文章着重于运用ARMA-BP神经网络组合模型来预测财政收入时间序列, 该组合模型充分发挥了单一模型的长处, 同时避免了单一模型的缺陷.实证分析也表明组合模型的预测精度优于单一模型, 且BP神经网络的预测精度优于ARMA模型.但是由于BP神经网络的理论体系还不太完善, 参数的确定主要借鉴一些经验方法, 导致预测结果充满了随机性.因此, 还需要对BP神经网络理论体系做进一步的学习和探究^[13], 以便改进组合预测模型.

参考文献

[1]	赖红松, 祝国瑞, 董品杰. 基于灰色预测和神经网络的人口预测[J]. 经济地理, 2004, 24(2): 197–201.

[2]	刘明凤, 修春波. 基于ARMA与神经网络的风速序列混合预测方法[J]. 中南大学学报(自然科学版), 2013, 44(1): 16–20.

[3]	王黎明, 王连, 杨楠. 应用时间序列分析[M]. 上海: 复旦大学出版社, 2009.

[4]	张德丰. MATLAB神经网络应用设计[M]. 北京: 机械工业出版社, 2011.

[5]	赵成柏, 毛春梅. 基于ARIMA和BP神经网络组合模型的我国碳排放强度预测[J]. 长江流域资源与环境, 2012, 21(6): 665–671.

[6]	雷可为, 陈瑛. 基于BP神经网络和ARIMA组合模型的中国入境游客量预测[J]. 旅游学刊, 2007, 22(4): 20–25.

[7]	王丰效. 组合预测模型预测精度的贴近度评价法[J]. 统计与决策, 2013(8): 70–72.

[8]	黄艳艳. 关于贴近度的性质及一个新公式[D]. 重庆: 西南大学硕士学位论文, 2009. http://www.docin.com/p-865812613.html

[9]	陈水利, 李敬功, 王向公. 模糊集理论及其应用[M]. 北京: 科学出版社, 2005.

[10]	张晓峒. Eviews使用指南与案例[M]. 北京: 机械工业出版社, 2007.

[11]	吴微, 陈维强, 刘波. 用BP神经网络预测股票市场跌涨[J]. 大连理工大学学报, 2001, 41(1): 9–15.

[12]	葛哲学, 孙志强. 神经网络理论与MATLAB R2007实现[M]. 北京: 电子工业出版社, 2007.

[13]	冯春山, 吴家春, 蒋馥. 石油价格的组合预测研究[J]. 石油大学学报(社会科学版), 2004, 20(1): 12–14.