欢迎来到梦题库!                  请登录       注册      今天是2026/3/3
12
课程 题库 下载 答疑
你当前的位置:网站首页>>实务精讲

2018年高级统计师《案例分析》精讲56

更新日期:2018/5/25 16:11:11

第四节 相关与回归的应用需注意的问题

相关与回归分析主要应用于统计预测和控制。有关预测与控制的方法,本书第九章将有详细的介绍。这里主要是说明一些在相关与回归的应用中,需要注意的几个问题。

一、回归分析中主要因素的选择

在回归分析中,我们常常面临的问题是如何判别在诸多因素中哪些是影响预测估计量(即因变量)的主要因素,从而在为数众多的因素中挑选对预测估计量影响较为显著的自变量,以建立较为理想的回归分析模型。

回归分析中主要因素的选择,仅凭直观的分析往往是不够的,因为自变量之间也会相互影响,有些自变量孤立地看,对因变量有作用,但其作用有时可能被其他自变量替代,使之在回归方程中变得无足轻重。

为了分清一组因素(即自变量)对被估计量(即因变量)影响的主次关系,我们介绍下面四项指标来进行判断。

1.偏相关系数

偏相关系数的计算在本章第一节已有介绍,一般来说,偏相关系数的编对值较大的那些自变量对估计量的影响也较大,可选择作为必需考虑的自变量。

2.Beta系数

多元回归方程中回归系数的经济意义是:y对自变量xi的回归系数bi是在其它所有因素都不变的情况下,xi变化一个单位时,y的平均变动量。因此回归系数的绝对值愈大,愈说明该因素重要。但是直接比较回归系数来判断因素对估计量y影响的显著性是不行的。因为回归系数的大小与自变量所取的计量单位有关。为了消除这个影响,就需要计算Beta系数(亦称标准回归系数),其计算公式:

β与y及xi所取的计量单位无关,因此它的绝对值愈大,该因素就愈重要,相应的因素对估计量y的影响就愈大。

用Beta系数判断回归分析中因素的主次关系比较直观,但这种方式方法只有当各自变量之间的相关性较小时才正确。如果在一个多元回归分析中所考虑的因素彼此之间有很密切的关系,应用这种方法反而可能得出不正确的结论。

3.偏回归平方和

设ui为回归因子x1的偏回归平方和,其计算方式为:

其中:cii是矩阵c=(X′X)-1中的对角线的元素。

凡是偏回归平方和大的那些因素,一定是对估计量y有重要影响的因素,ui愈大,该因素对估计量y的影响作用也就愈大。

4.t检验统计量

在多元回归分析中,为了从回归方程中剔除那些次要的,可有可无的变量,建立较为理想的多元回归方程,就需要我们对每个自变量xi进行考察。事实上如果某个自变量xi对估计量y的作用不显著,那么在多元回归方程中,就相当于它前面的回归系数bi可以取值为零,换言之即剔除了这个自变量。因此,检验自变量xi对估计量y的影响是否显著,相当于假设检验H0∶bi=0。

所采用的检验统计量称为t的检验统计量,其计算公式为:

式中:Q=Σ(y-yc)2称为剩余变差,m为多元回归方程中自变量的个数。

若|t|<tx(tx可通过查表求得),

则说明通过显著性水平α的t检验,自变量xi在多元回归方程中不起什么作用,可以从回归方程中剔除。反之,则可保留。

以上我们粗略阐述了多元回归分析中主要因素选择的问题,以建立较为理想的多元回归方程。更深入的问题,有兴趣的读者可阅读数理统计专著的有关内容。

【上一条】   【下一条】
你当前的位置:网站首页>>实务精讲

2018年高级统计师《案例分析》精讲56

更新日期:2018/5/25 16:11:11

第四节 相关与回归的应用需注意的问题

相关与回归分析主要应用于统计预测和控制。有关预测与控制的方法,本书第九章将有详细的介绍。这里主要是说明一些在相关与回归的应用中,需要注意的几个问题。

一、回归分析中主要因素的选择

在回归分析中,我们常常面临的问题是如何判别在诸多因素中哪些是影响预测估计量(即因变量)的主要因素,从而在为数众多的因素中挑选对预测估计量影响较为显著的自变量,以建立较为理想的回归分析模型。

回归分析中主要因素的选择,仅凭直观的分析往往是不够的,因为自变量之间也会相互影响,有些自变量孤立地看,对因变量有作用,但其作用有时可能被其他自变量替代,使之在回归方程中变得无足轻重。

为了分清一组因素(即自变量)对被估计量(即因变量)影响的主次关系,我们介绍下面四项指标来进行判断。

1.偏相关系数

偏相关系数的计算在本章第一节已有介绍,一般来说,偏相关系数的编对值较大的那些自变量对估计量的影响也较大,可选择作为必需考虑的自变量。

2.Beta系数

多元回归方程中回归系数的经济意义是:y对自变量xi的回归系数bi是在其它所有因素都不变的情况下,xi变化一个单位时,y的平均变动量。因此回归系数的绝对值愈大,愈说明该因素重要。但是直接比较回归系数来判断因素对估计量y影响的显著性是不行的。因为回归系数的大小与自变量所取的计量单位有关。为了消除这个影响,就需要计算Beta系数(亦称标准回归系数),其计算公式:

β与y及xi所取的计量单位无关,因此它的绝对值愈大,该因素就愈重要,相应的因素对估计量y的影响就愈大。

用Beta系数判断回归分析中因素的主次关系比较直观,但这种方式方法只有当各自变量之间的相关性较小时才正确。如果在一个多元回归分析中所考虑的因素彼此之间有很密切的关系,应用这种方法反而可能得出不正确的结论。

3.偏回归平方和

设ui为回归因子x1的偏回归平方和,其计算方式为:

其中:cii是矩阵c=(X′X)-1中的对角线的元素。

凡是偏回归平方和大的那些因素,一定是对估计量y有重要影响的因素,ui愈大,该因素对估计量y的影响作用也就愈大。

4.t检验统计量

在多元回归分析中,为了从回归方程中剔除那些次要的,可有可无的变量,建立较为理想的多元回归方程,就需要我们对每个自变量xi进行考察。事实上如果某个自变量xi对估计量y的作用不显著,那么在多元回归方程中,就相当于它前面的回归系数bi可以取值为零,换言之即剔除了这个自变量。因此,检验自变量xi对估计量y的影响是否显著,相当于假设检验H0∶bi=0。

所采用的检验统计量称为t的检验统计量,其计算公式为:

式中:Q=Σ(y-yc)2称为剩余变差,m为多元回归方程中自变量的个数。

若|t|<tx(tx可通过查表求得),

则说明通过显著性水平α的t检验,自变量xi在多元回归方程中不起什么作用,可以从回归方程中剔除。反之,则可保留。

以上我们粗略阐述了多元回归分析中主要因素选择的问题,以建立较为理想的多元回归方程。更深入的问题,有兴趣的读者可阅读数理统计专著的有关内容。

       
高级统计师选课中心  
培训课程
名师试听
热销套餐
课程名称
试听
价格
报名
高级统计实务教程(有视频无纸质)
98元
历年考试真题含解析无纸质
48元
统计时政热点及备考资料无纸质
98元
高级统计押题密卷含热点(纸质)
158元
高级统计网授班(含题库班全套资料有视频)有纸质
339元
题库班+押题(有纸质)
298元
网授班+押题(有纸质)
439元
网页左侧浮动jquery在线QQ客服代码
  • 客服金老师