初中生入学规模的线性组合预测研究 不是线性组合等价于

  【摘 要】根据TC县2001-2011年初中生入学人数的统计数据近似线性变化的趋势,分别以一元线性回归模型和趋势移动平均模型对当地未来5-10年的生源规模进行预测,再以平均误差平方和越小越优为原则确定各模型的权重进行组合预测,最终的预测结果取得了比两者中任何一种单独预测更好的效果,可以作为XX县近期或中期初中入学规模的参考。
  【关键词】生源规模;线性回归;二次指数平滑;组合预测
  
  生源规模是确定财政教育支出和师资等教育资源配置的重要依据,随着城市化进程的深化各个地区的生源规模有着不同的发展趋势。影响生源的因素很多,在已有研究不足的情况下以某地区入学人数的时间序列为依据进行当地生源规模预测是比较可行的方法。
  根据已有的XX县2001-2011年初中生入学人数的时间序列呈现的特征(见图1),本文采用一元线性回归模型和趋势移动平均模型的组合预测方法对当地未来初中生源规模进行预测。
  一、线性回归预测法
  已知有n组样本,变量近似呈线性关系,则其回归模型为:
  其中:yi―因变量;xi―自变量;εi―随机扰动;a、b―待估计参数。
  由最小二乘法,
  可得:
   (1)
  则得出回归方程为: (2)
  其中:―预测值;―截距;―回归系数。
  判定系数R2度量了回归方程对观测数据的拟合程度。R2的值越大,表明因变量与自变量之间的相关性越强,回归直线拟合效果越好。回归系数检验:当时就拒绝H0,认为回归方程有显著意义。
  二、趋势移动平均法
  当时间序列具有周期波动特点但呈线性变化趋势时,使用趋势移动平均法能消除周期变动和不规则影响,可取的较好的预测效果。设观测序列,其具体构成如下:
  
  一次移动平均数: (3)
  二次移动平均数: (4)
  预测模型为: (5)
  其中:分别为t期的一次、二次移动平均数,为时间序列的观测数据[2],T为需要预测的未来时期;N为移动平均项数,其值的大小反映移动平均数的修匀性强弱和对趋势的灵敏度。选取N时通常遵循两个原则:如果序列发展的总趋势比较平稳,波动不大,则N应取大一点,使平滑的效果更显著;如果序列的总趋势不稳定,波动较大,且外部影响正在改变,则N应取小一点,使Mt更适应当前变化的趋势。在实践中,常用几个N值进行试算,比较他们的均方误差MSE,选取均方误差较小的那个N,本文采用试算法确定N。
  三、组合权重的确定
  分别计算两种单项预测方法的均方误差,MSE越小则模型的预测效果越好。由于本次线性回归预测和趋势移动平均预测都是基于线性趋势的时间序列预测方法,故组合预测可以根据各自MSE比重确定两种方法的权重和,得到组合预测:
   (6)
  其中:―组合预测值;―线性回归方法预测值;―二次指数平滑方法预测值。
  
  
  四、生源规模的组合预测分析
  本次TC县初中生入学规模的线性回归预测方法以时间为自变量,已有2001-2011年观测样本数据见表1:
  表1 XX县2001-2011年初中入学人数 单位:人
  年份 2001 2002 2003 2004 2005 2006 2007
  人数 16058 15789 15200 12100 13115 13218 14886
  年份 2008 2009 2010 2011
  人数 12113 10038 11380 9105
  
  数据来源:XX县统计年鉴2001-2011
  运用(1)式和(2)式以及表1中时间序列数据得到回归预测公式如下:
  R2=0.7387
  tb=-5.04425
  t表示时间,2001年t=1,2002年t=2…以此类推,当t>11时即为相应期间的预测值,得到的判断系数R2=0.7387,表明拟合效果可以接受;回归系数t值tb=-5.04425,可通过5%水平的显著性检验,说明取得的回归方程具有显著意义。但基于生源规模影响因素较多以及所得的回归方程本身的局限(t>27时,)本次线性回归较适宜做中短期预测(仅预测至2016年,t=16)。
  在应用趋势移动平均法时经过试算可知当移动平均项数N取5使得均方误差最小,故令N=5;利用(3)式、(4)式和(5)式以及表1中的数据得到趋势移动平均法预测模型为:
  
  基于与线性回归模型预测中同样的原因,趋势移动平均预测模型也更适于中短期预测(预测至2016年,T=6)。
  两种预测方法的均方误差分别为:MSE1= 1276836,MSE2=1614509,则=0.5584,=0.4416;由式(6)可得组合预测模型为:
  
  进而可以根据此模型求到TC县初中生入学规模近期和中期的预测结果,具体预测值见表2
  表2 XX先初中生入学规模的组合预测成果 单位:人
  时间 2012 2013 2014 2015 2016 2017* 2018* 2019*
  值 9395 8794 8194 7593 6992 6391* 5790* 5190*
  值 9792 9235 8678 8120 7563 7006* 6448* 5891*
  值 9571 8989 8407 7826 7244 6662* 6081* 5499*
  
  注:预测值以四舍五入法化为整数;*表示可靠性不确定
  TC县初中生入学人数时间序列的观测值和不同预测方法的预测结果趋势见图1。
  
  图1 观测值与预测值趋势图
  由图1可知,2001-2011年初中入学规模的观测值呈波动下滑趋势,选择线性回归预测法和趋势移动平均预测法是合理有效的,且拟合的线性回归方程和趋势移动平均预测得到的斜率比较接近,但组合预测能够降低两者预测的均方误差,给出更精准的初中生入学规模趋势和预测值。
  五、结论
  以TC县已有的初中入学人数统计结果进行一元线性回归得到的判断系数R2=0.74,表明初中生源规模与时间基本具有线性相关关系,如果能补充一些政策方面虚拟变量或人口流动、经济发展等方面的变量拟合的效果可以得到提高;在未引入其他变量的时候运用组合预测方法可以提高预测的可靠性,但鉴于本次组合预测基于生源规模线性变换的假设,只适宜进行中短期预测;生源规模的长期预测需要分析更多因素的影响机制,可作为未来相关研究的重点加以考虑。
  
  参考文献:
  [1]唐小我.组合预测计算方法研究[J].预测.1991.(4):35-39.
  [2]张磊,郑丕谔.组合预测分析方法及其在物资运输管理中的应用[J].工业工程.2007.5:103.
  
  作者简介:李兆君(1985-),女,河海大学行政管理专业硕士研究生,研究方向:人力资源管理。

推荐访问:组合 初中生 线性 入学