城市居民食品零售价格预测—ARIMA 模型 的应用 文小兵,童恒庆** 作者简介:文小兵,(1988-),男,硕士研究生,应用统计,计量经济。 通信联系人:童恒庆,(1947-),男,教授,心理学,应用统计等。E-mail: tonghq2005@whut.edu.cn 5 (武汉理工大学理学院,武汉 430070) 摘要:本文通过2010 年3 月到2011 年2 月城市居民食品零售的消费价格预测2011 年4、5 月的城市居民食品零售价格走势。引进食品零售价格指数和膳食宝塔理论。通过膳食宝塔确 定各类食品的权数,再对各类食品的零售价格指数加权平均,得到总体食品价格指数。用 Eviews 软件画出总体食品价格指数的走势图,因其走势特征适合ARIMA 模型,因此我们选 10 择ARIMA 模型来预测4、5 月份价格指数。 关键词:经济预测;ARIMA 模型;Eviews;价格指数;膳食宝塔 中图分类号:F201 The urban residents food retail price forecast - Application 15 of ARIMA model Wen XiaoBing, Tong HengQing (Wuhan Uniwersity of Technology, Faculty of science, WuHan 430070) Abstract: This paper is to forecast the food retail price tends of urban residents in April and May 2011 by the urban residents’ food retail price from March 2010 to February 2011.Introduce the 20 food retail price index and dietary pagoda theory. Base on the dietary pagoda theory, to determine the weights of the various types of food, and then weighted average the retail price index of all kinds of food, obtain the overall food price index. Use the Eviews software to draw the overall food price index charts. The charts’ trend characteristics is fit to ARIMA model, so chose the ARIMA model to predict the price index in April and May. 25 Keywords: Economic forecasts; ARIMA model; Eviews; Price index; dietary pagoda 0 引言 城市居民食品零售价格是消费者物价指数的重要组成部分,权威机构研究认为粮食生 产、流通成本上涨一定会带动农产品价格总体上涨,特别是2011 年异常的气候情况,导致 30 生产成本大量增加,国际粮价对国内供需的影响,食品价格未来可能发生上涨。2011 年3 月份的CPI 增幅达5.4%,创32 个月来的新高,这使得年内的通货膨胀压力正在增强。当前 城市居民食品零售价格——消费者物价指数的重要组成部分,变动趋势受粮食生产、流通成 本、异常的气候、国际粮价等等诸多因素的影响,从而对CPI 走势在一定程度上有重要影响。 因此,对城市居民食品合理分类及零售价格预测具有重要意义。通过数学建模的形式研究城 35 市居民食品零售价格预测情况客观真实,有助于消费者的直观理解。目前用于预测的模型有 很多,ARIMA 是其中一种[1]。 1 ARIMA 模型 ARIMA(p,d,q)模型是1970 年由美国统计学家GEP.Box 和GM.Jenkins 提出的,这是 用来预测精度相对较高的动态数据建模方法[2]。ARIMA(p,d,q)模型的实质就是差分运算 40 与ARMA 模型的组合。任何非平稳序列只要通过适当除数的差分运算实现差分后平衡,就 可以对差分后序列进行ARMA 模型拟合。ARIMA(p,d,q)模型如下: 2 ( ) ( ) ( ) 0, ( ) , ( ) 0, ( ) 0, d t t t t t s s t B X B E Var E s t E X s t ε ε ε σ ε ε ε ⎧ Φ ∇ =Θ ⎪ = = = ≠ ⎨⎪ ⎩ = ∀ < (1) 式中, 1 ( ) 1 p p ΦB= −φB−L−φB为平稳可逆ARMA(p,q)模型的自回归系数多项式, 1 ( ) 1 q q B B B θ θ Θ = − − − L ,为平稳可逆ARMA( , ) p q 模型的移动平滑系数多项式, t ε { }为 45 零均值白噪声序列,∇d= (1− B)d。 2 ARIMA 模型的建模步骤 第一步,数据平稳性检验:首先要对时间序列数据进行平稳性检验。可以通过时间序列 的散点图或折线图对序列进行初步的平稳性判断。一般采用ADF 单位根检验来精确判断该 序列的平稳性。对非平稳的时间序列, 如果存在一定的增长或下降趋势等, 常需要对数据取 50 对数或进行差分处理, 然后判断经处理后序列的平稳性。重复以上过程, 直至成为平稳序列。 此时差分的次数即为ARIMA(p,d,q)确定性信息。但应当注意的是,差分运算的阶数并不是 越多越好。因为差分运算是一种对信息的提取、加工过程, 每次差分都会有信息的损失, 所 以在实际应用中差分运算的阶数要适当, 应当避免过渡差分, 简称过差分的现象。对平稳序 列还需要进行纯随机性检验, 又称白噪声检验, 即检验序列是否为白噪声序列。白噪声序列 55 没有分析的必要, 对于平稳的非白噪声序列则可以进行ARMA(p,q)模型的拟合。白噪声检 验通常使用Q 统计量对序列进行卡方检验[3]。 第二步,对差分后平稳序列进行ARMA 拟合:为简单起见, 差分后的平稳序列仍记为 { }t y 。对时间序列{ }t y 进行ARMA(p,q) 模型拟合, 首先是要计算时间序列样本的自相关 系数(ACF) 和偏自相关系( PACF) 的值。然后根据自相关系数和偏自相关系数的性质来估计 60 自相关阶数p 和移动平均阶数q 的值, 以选择适当的ARMA(p,q)模型进行拟合。选择模型 的定阶原则如表: 表1 ARMA(p,q)定价原则 模型 自相关系数 偏自相关系数 AR(p) 拖尾 p 阶截尾 MA(q) q 阶截尾 拖尾 ARMA(p,q) 拖尾 拖尾 由于样本的随机性, 样本的相关系数不会呈现出理论截尾的完美情况, 本应截尾的相关 65 系数仍会呈现出小值振荡的情况。又由于平稳时间序列通常都具有短期相性, 随着延迟阶数 的增大, 相关系数都会衰减至零值附近作小值波动。根据Barlett 和Quenouille 的证明, 样本 相关系数近似服从正态分布。我们知道, 一个正态分布的随机变量在任意方向上超出2σ 的 概率约为0.05。因此, 可以通过自相关和偏自相关估计值序列的直方图来大致判断在5%的 显著水平下模型的自相关系数和偏自相关系数不为零的个数, 进而大致判断序列应选择的 70 具体模型形式。那么, 要对模型中的p 和q 两个参数进行多种组合选择, 从ARMA(p,q) 模型中选择一个拟和最好的曲线作为最后的方程结果。一般利用Akaike 提出的AIC 准则和 Schwartz 提出的SBC 准则评判拟合模型的相对优劣, 即使上述两个AIC 和SBC 函数值达到 最小的模型为相对最优模型[4]。 第三步,参数检验:参数的检验就是要检验每个参数是否显著非零,通常应剔除不显著 75 参数所对应的自变量并重新拟合模型, 以构造出结构更精炼的拟合模型。本文利用SAS 软 件对ARMA(p,q) 模型p+q+2 个参数进行估计, 一般选择最小二乘法。其中参数μ是序 列均值, 通常取样本均值来代替。如果对序列进行中心化处理后, 模型参数将变p+q+1 个。 第四步,模检验型:模型检验主要是检验模型对原时间序列的拟和效果, 就是检验整个 80 模型对信息的提取是否充分, 即检验残差序列是否为白噪声序列。如果拟合模型通不过检验, 即残差序列不是为白噪声序列[5], 那么要重新选择模型进行拟合。如残差序列是白噪声序列, 就认为拟合模型是有效的。模型的有效性检验仍然是使用上述Q 统计量对残差序列进行卡 方检验。对模型进行Ljung-Box 检验,若各点的P 值都大于0.05,则残差序列为白噪声,模 型通过检验。若模型不通过检验,则调整p 和q 两个参量,直到模型可用为止。若存在多 85 组p 和q 值使模型可用,则比较其AIC 值,取AIC 最小的一组p 和q 参量。 第五步,模型预测:根据检验和比较的结果, 选择最后的方程模型,使用SAS 软件对模 型进行预测, 得到原时间序列的将来走势。 3 实证研究 先对2010 年3 月到2011 年3 月的各类食品的价格数据(见附录)进行预处理,选定 90 2010 年3 月的食品价格为基期价格。其后每个月的价格与2010 年3 月的价格之比就是当月 的定基价格指数。然后再利用膳食宝塔理论确定每一类食品的权重,对各类的价格指数进行 加权平均得到重的食品价格指数如下表。 表2 城市居民食品定基价格指数 2010-3-5 100 2010-7-15 94.45 2010-11-25 106.44 2010-3-15 99.1 2010-7-25 97.18 2010-12-5 107 2010-3-25 98.90 2010-8-5 98.4 2010-12-15 109.05 2010-4-5 97.76 2010-8-15 100.67 2010-12-25 110.37 2010-4-15 96.9 2010-8-25 100.67 2011-1-5 109.95 2010-4-25 97.49 2010-9-5 100.68 2011-1-15 109.45 2010-5-5 95.32 2010-9-15 100.65 2011-1-25 111.77 2010-5-15 93.92 2010-9-25 100.67 2011-2-5 114.69 2010-5-25 92.52 2010-10-5 100.55 2011-2-15 115.25 2010-6-5 92.49 2010-10-15 101.6 2011-2-25 113.65 2010-6-15 92.77 2010-10-25 103.61 2011-3-5 114.14 2010-6-25 91.35 2010-11-5 105.54 2011-3-15 113.85 2010-7-5 91.42 2010-11-15 107.32 2011-3-25 113.88 95 由表2 中的食品价格指数使用Eviews 软件可得下面的趋势图。 90 95 100 105 110 115 120 5 10 15 20 25 30 35 图1 城市居民零售价指数趋势图 100 从图1 可以看出价格指数有明显上升趋势,是非平稳序列。一般来说,对非平稳序列采 用差分方法可以实现序列平稳。这样我们对价格指数进行一阶差分(1 ) t t Y= −BX,对表1 中的数据进行一阶差分后所得数据再利用Eviews 画图得下面序列图。 -3 -2 -1 0 1 2 3 4 5 10 15 20 25 30 35 图2 城市居民零售价指数一阶差分趋势 105 ARMA 模型的建模方法是以序列平稳性为前提。从图2 中可以看出序列无明显趋势。 但是为了判断其是否平稳还需要进行检验。通过Eviews 软件对一阶差分序列进行单位根检 验,检验结果如表。 表4 一阶差分单位根检验 Null Hypothesis: D(SERIES01) has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=9) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -3.790853 0.0066 Test critical values: 1% level -3.626784 5% level -2.945842 10% level -2.611531 *MacKinnon (1996) one-sided p-values. 110 对该序列做单位根检验,原假设: 0H:λ ≥1,备择假设: 1H:λ <1,从上述结果可以 看出t 统计量显著大于1,原假设成立。认为{ } t Y 序列已经很平稳,可以针对该序列进一步 做ARIMA 模型拟合,因此利用Eviews 软件作序列{ } t Y 的自相关图,所得结果如图4 所示。 115 图4 序列{Yt }的自相关图 根据上图,我们可以判断自相关图与偏相关图都一阶截尾,因此我们选择ARMA(1,1) 模型。使用Eviews 软件对模型的拟合优度进行检验。检验结果如表5 所示。 120 表5 ARMA(1,1)模型检验 Dependent Variable: SERIES01 原创学术论文网Tag:代写论文 代写硕士论文 代写MBA论文 |