第五章 平均预测法与回归分析法
发布时间:2019-12-07 15:15来源:未知
第五章 平均预测法与回归分析法
这章主要介绍定量教育预测方法中的平均预测法和回归预测法。
必须重点掌握它们的特点、程序、使用条件和应注意的相关事项等内容。
本章比较难理解的是回归分析法的应用。
本章内容常以名词解释、单项选择题和计算题的形式出现。
第一节:平均预测法
平均预测法就是将一段时期的数据或者一组同类数据平均而推测事物未来发展的方法。
这种方法有多种具体的计算模型,如算数平均预测法、几何平均预测法、移动平均预测法和指数平滑预测法等。由于这些模型的根本区别是平均数类型不同。不同的平均数具有不同的计算方法、适用范围和条件。
一、算术平均预测法
(一)算术平均数预测法
算术平均预测法是将若干同类观察数据的算术平均数作为预测值的预测方法。
算数平均数的公式:

式中,
代表算术平均年数
(i=1,2,…n)代表实际观察数据
N代表实际观察数据的个数
在应用算术平均预测法,应特别注意数据的变化规律,如果数据有明显的上升或下降趋势,则不能采用算术平均预测法。
(二)加权平均数法
首先,以一个称为权数的数值来代表每一个数据重要性的程度;然后求每个数据与对应的权数之积的和;最后,将此和除以各个权数之和,就得到相应的加权平均数,这种方法就叫加权平均法。
【例】 6年来,有一自学考试科目的合格率分别是0.20,0.35,0.25,0.30,0.40,0.35,它们的权数分别为0.1,0.1,0.15,0.15,0.2,0.3,求6年来该自学考试科目合格率的加权平均数。
【答案】0.3225
【解析】
=(0.1*0.20+0.1*0.35+0.15*0.25+0.15*0.30+0.2*0.40+0.3*0.35)÷(0.1+0.1+0.15+0.15+0.2+0.3)=0.3225
二、移动平均预测法
移动平均预测法是一种传统的时间序列预测方法。在平均间隔不变的情况下,每次后移一位求相应间隔的平均数,并根据此平均数数列的变化规律来进行预测的方法,这被称为移动平均预测法。
公式如下:
=(Xt+ Xt-1+…+ Xt-k-1)÷k
是移动平均数
t 表示时间序列的时期序号
k 表示选取的时间间隔
Xi(i=t-k+1,t-k+2,…,t)表示i时期的实际值
举个例子,某校1986、1987、1988、1989、1990、1991六年在校生数分别为1000、1100、1200、1100、1100、1200,求间隔3年(K=3)的移动平均数。
首先,求第一个加第二个加第三的和,然后除以3,得到第一个移动平均数,即(1000+1100+1200)÷3=1100;
其次,求第二个加第三个加第四第个的和,然后除以3,得第二个移动平均数,即(1100+1200+1100)÷3=1133
以此类推,直到计算完最后一个数。
K的含义是间隔数。
k值越小,即间隔越小,越能反映出时间序列的变化细节,而修匀能力下降,当K=1时,即是原始时间序列;
反之,当K值越大时,所得移动平均数列反映的变化就越趋于平缓,当K值等于全部原始数据的个数时,移动平均数列就是一个算术平均数。因此,在实际应用移动平均预测法时,应根据具体情况选择适当大小的K值。
四种取值要求或规律:
移动的三种方式:
1、脉冲式指当时间序列仅在一段时间变化比较剧烈时,在其他时间变化比重较平稳,应取比较大的K值,以便比较好地修匀时间序列的变化趋势的变化方式。
2、阶梯式就是当时间序列以阶段性的规律发展时,应取比较小的K值,这样才能更好的反应数据发展变化的阶段性的变化方式。
3、斜坡式就是当时间序列的发展趋势比较明显变化时,移动平均数数列落后于实际变化趋势,应取较小的K值以减少预测误差的变化方式。
4、平稳式就是当时间序列的发展趋势无明显变化时,k值大小不作过多要求的变化方式。
第二节 指数平滑预测法
指数平滑法是指权重系数按照指数规律递减的加权平均预测法。
平滑系数ɑ大小起着调节增减修正量多少的作用。不平平滑系数的值对预测效果的影响有明显差异。平滑系数ɑ的值越小,其平滑功能越强。实际选择ɑ的值,需要考虑历史数据的特征以及预测误差的大小。
第三节 回归预测法
一、一元线性回归方程
(一)含义
回归预测法是指一种从变量之间变化的统计伴随关系出发对事物的发展进行预测的梳理统计方法。可分为一元回归预测法和多元回归预测法。
回归预测法在教育预测领域有广泛的应用,既有微观的个人成就、能力等发展水平的预测;又有宏观的人才需求、教育规模等全局问题的预测。
回归预测法也被称为因果预测法。以自变量的个数为标志,可以将回归预测分为一元回归预测和多元回归预测。以自变量和因变量的线性与非线性关系为标准,可以将回归预测分为线性回归预测和非线性回归预测。
(二)一元线性回归预测法的基本过程
1、绘制散点图
散点图又称散点分布图,它是以一个变量为横坐标,另一个变量为纵坐标,利用散点(即坐标点)的分布形态反映变量统计关系的一种图形。
散点图的优点是能通过直观醒目的图形反映出影响因素和预测对象之间关系的变化形态,以便决定用何种类型的数学表达式来模拟变量之间的关系。同时,散点图也能反映出影响因素与预测对象间关系的明确程度。
2、构建一元线性回归方程
(1)公式:

代表预测对象Y的估计值;X代表影响预测对象的相关因素;
、
代表回归系数。
(2)回归系数
关键是要确定回归系数b0和b1。一般利用数理统计中的最小二乘法求出回归数b0和b1。
计算回归系数b0和b1公式如下:

Xi、Yi分别代表自变量或影响因素X和预测对象Y的实际观测数据。
考试中,经常有这方面的计算题。要求出回归系数b0和b1,关键是理解上述两个公式特别是求b1的公式中各项的含义。
3、一元线性回归方程相关显著性检验
一元线性回归预测的最基本得假设就是变量x与变量Y之间存在着线性关系。
因此,一元线性回归方程建立后,必须进行变量间相关性检验。
相关性检验就是根据变量X与变量Y之间相关系数r的相对大小来判断线性关系的大小。r越接近1,表示Y与X之间接近与线性关系;趋于0 这表示Y与X之间偏离线性关系。
检验方法是:
(1)求出变量Y和变量X之间的相关系数r。
相关系数r计算公式为:

(2)根据自由度df=n-2计算出自由度df的值,在相关系数临界表(见教材附录,考试时一般会在试卷中提供)中查出相应自由度的相关系数临界值
(3)r与
相比较,判定变量Y与变量X之间的相关性是否显著。
一般情况下,只有当r的绝对值大于查出的临界值ra时,才认为r的相关程度显著,即认为变量Y与变量X之间存在着显著的一元线性关系;反之,则认为r的相关程度不显著,即认为变量Y与变量X之间不存在着显著的一元线性关系。
例:1、根据表中的数据,建立学生高考化学等级成绩Y关于平时化学成绩X的线性回归方程。
表一
计算公式:

2、从表1中数据算得变量X与变量Y的相关系数为
=0.944,取自由度df=n-2,在0.01水平下,问变量Y与变量X之间是否存在显著的一元线性回归关系?
表2
解: 1、


所以,一元回归方程为:

2、
df=4-2=2
临界值
0.990>0.944
所以,变量Y与变量X之间不存在显著的一元线性回归关系。
这章主要介绍定量教育预测方法中的平均预测法和回归预测法。
必须重点掌握它们的特点、程序、使用条件和应注意的相关事项等内容。
本章比较难理解的是回归分析法的应用。
本章内容常以名词解释、单项选择题和计算题的形式出现。
第一节:平均预测法
平均预测法就是将一段时期的数据或者一组同类数据平均而推测事物未来发展的方法。
这种方法有多种具体的计算模型,如算数平均预测法、几何平均预测法、移动平均预测法和指数平滑预测法等。由于这些模型的根本区别是平均数类型不同。不同的平均数具有不同的计算方法、适用范围和条件。
一、算术平均预测法
(一)算术平均数预测法
算术平均预测法是将若干同类观察数据的算术平均数作为预测值的预测方法。
算数平均数的公式:

式中,


N代表实际观察数据的个数
在应用算术平均预测法,应特别注意数据的变化规律,如果数据有明显的上升或下降趋势,则不能采用算术平均预测法。
(二)加权平均数法
首先,以一个称为权数的数值来代表每一个数据重要性的程度;然后求每个数据与对应的权数之积的和;最后,将此和除以各个权数之和,就得到相应的加权平均数,这种方法就叫加权平均法。
【例】 6年来,有一自学考试科目的合格率分别是0.20,0.35,0.25,0.30,0.40,0.35,它们的权数分别为0.1,0.1,0.15,0.15,0.2,0.3,求6年来该自学考试科目合格率的加权平均数。
【答案】0.3225
【解析】

二、移动平均预测法
移动平均预测法是一种传统的时间序列预测方法。在平均间隔不变的情况下,每次后移一位求相应间隔的平均数,并根据此平均数数列的变化规律来进行预测的方法,这被称为移动平均预测法。
公式如下:


t 表示时间序列的时期序号
k 表示选取的时间间隔
Xi(i=t-k+1,t-k+2,…,t)表示i时期的实际值
举个例子,某校1986、1987、1988、1989、1990、1991六年在校生数分别为1000、1100、1200、1100、1100、1200,求间隔3年(K=3)的移动平均数。
首先,求第一个加第二个加第三的和,然后除以3,得到第一个移动平均数,即(1000+1100+1200)÷3=1100;
其次,求第二个加第三个加第四第个的和,然后除以3,得第二个移动平均数,即(1100+1200+1100)÷3=1133
以此类推,直到计算完最后一个数。
K的含义是间隔数。
k值越小,即间隔越小,越能反映出时间序列的变化细节,而修匀能力下降,当K=1时,即是原始时间序列;
反之,当K值越大时,所得移动平均数列反映的变化就越趋于平缓,当K值等于全部原始数据的个数时,移动平均数列就是一个算术平均数。因此,在实际应用移动平均预测法时,应根据具体情况选择适当大小的K值。
四种取值要求或规律:
移动的三种方式:
1、脉冲式指当时间序列仅在一段时间变化比较剧烈时,在其他时间变化比重较平稳,应取比较大的K值,以便比较好地修匀时间序列的变化趋势的变化方式。
2、阶梯式就是当时间序列以阶段性的规律发展时,应取比较小的K值,这样才能更好的反应数据发展变化的阶段性的变化方式。
3、斜坡式就是当时间序列的发展趋势比较明显变化时,移动平均数数列落后于实际变化趋势,应取较小的K值以减少预测误差的变化方式。
4、平稳式就是当时间序列的发展趋势无明显变化时,k值大小不作过多要求的变化方式。
第二节 指数平滑预测法
指数平滑法是指权重系数按照指数规律递减的加权平均预测法。
平滑系数ɑ大小起着调节增减修正量多少的作用。不平平滑系数的值对预测效果的影响有明显差异。平滑系数ɑ的值越小,其平滑功能越强。实际选择ɑ的值,需要考虑历史数据的特征以及预测误差的大小。
第三节 回归预测法
一、一元线性回归方程
(一)含义
回归预测法是指一种从变量之间变化的统计伴随关系出发对事物的发展进行预测的梳理统计方法。可分为一元回归预测法和多元回归预测法。
回归预测法在教育预测领域有广泛的应用,既有微观的个人成就、能力等发展水平的预测;又有宏观的人才需求、教育规模等全局问题的预测。
回归预测法也被称为因果预测法。以自变量的个数为标志,可以将回归预测分为一元回归预测和多元回归预测。以自变量和因变量的线性与非线性关系为标准,可以将回归预测分为线性回归预测和非线性回归预测。
(二)一元线性回归预测法的基本过程
1、绘制散点图
散点图又称散点分布图,它是以一个变量为横坐标,另一个变量为纵坐标,利用散点(即坐标点)的分布形态反映变量统计关系的一种图形。
散点图的优点是能通过直观醒目的图形反映出影响因素和预测对象之间关系的变化形态,以便决定用何种类型的数学表达式来模拟变量之间的关系。同时,散点图也能反映出影响因素与预测对象间关系的明确程度。
2、构建一元线性回归方程
(1)公式:




(2)回归系数
关键是要确定回归系数b0和b1。一般利用数理统计中的最小二乘法求出回归数b0和b1。
计算回归系数b0和b1公式如下:

Xi、Yi分别代表自变量或影响因素X和预测对象Y的实际观测数据。
考试中,经常有这方面的计算题。要求出回归系数b0和b1,关键是理解上述两个公式特别是求b1的公式中各项的含义。
3、一元线性回归方程相关显著性检验
一元线性回归预测的最基本得假设就是变量x与变量Y之间存在着线性关系。
因此,一元线性回归方程建立后,必须进行变量间相关性检验。
相关性检验就是根据变量X与变量Y之间相关系数r的相对大小来判断线性关系的大小。r越接近1,表示Y与X之间接近与线性关系;趋于0 这表示Y与X之间偏离线性关系。
检验方法是:
(1)求出变量Y和变量X之间的相关系数r。
相关系数r计算公式为:

(2)根据自由度df=n-2计算出自由度df的值,在相关系数临界表(见教材附录,考试时一般会在试卷中提供)中查出相应自由度的相关系数临界值

(3)r与

一般情况下,只有当r的绝对值大于查出的临界值ra时,才认为r的相关程度显著,即认为变量Y与变量X之间存在着显著的一元线性关系;反之,则认为r的相关程度不显著,即认为变量Y与变量X之间不存在着显著的一元线性关系。
例:1、根据表中的数据,建立学生高考化学等级成绩Y关于平时化学成绩X的线性回归方程。
表一
序号 | X | Y |
![]() |
![]() |
XY |
1 | 60 | 3 | 3600 | 9 | 180 |
2 | 70 | 3 | 4900 | 9 | 210 |
3 | 80 | 4 | 6400 | 16 | 320 |
4 | 90 | 5 | 8100 | 25 | 450 |
合计 | 300 | 15 | 23000 | 59 | 1160 |
平均值 | 75 | 3.75 | -- | --- | --- |
计算公式:

2、从表1中数据算得变量X与变量Y的相关系数为

表2
df=n-2 |
![]() |
||||
.10 | .05 | .02 | .01 | .001 | |
1 | .988 | .997 | 1.000 | 1.000 | 1.000 |
2 | .900 | .950 | .980 | .990 | .999 |
3 | .805 | .878 | .934 | .959 | .991 |
4 | .729 | .811 | .882 | .917 | .974 |
解: 1、


所以,一元回归方程为:

2、
df=4-2=2
临界值

所以,变量Y与变量X之间不存在显著的一元线性回归关系。