| 欢迎来到梦题库! 请登录 注册 今天是2026/3/3 |
![]() |
![]() |
12 | ||||
| 课程 | 题库 | 下载 | 答疑 |
第四节 相关与回归的应用需注意的问题
相关与回归分析主要应用于统计预测和控制。有关预测与控制的方法,本书第九章将有详细的介绍。这里主要是说明一些在相关与回归的应用中,需要注意的几个问题。
一、回归分析中主要因素的选择
在回归分析中,我们常常面临的问题是如何判别在诸多因素中哪些是影响预测估计量(即因变量)的主要因素,从而在为数众多的因素中挑选对预测估计量影响较为显著的自变量,以建立较为理想的回归分析模型。
回归分析中主要因素的选择,仅凭直观的分析往往是不够的,因为自变量之间也会相互影响,有些自变量孤立地看,对因变量有作用,但其作用有时可能被其他自变量替代,使之在回归方程中变得无足轻重。
为了分清一组因素(即自变量)对被估计量(即因变量)影响的主次关系,我们介绍下面四项指标来进行判断。
1.偏相关系数
偏相关系数的计算在本章第一节已有介绍,一般来说,偏相关系数的编对值较大的那些自变量对估计量的影响也较大,可选择作为必需考虑的自变量。
2.Beta系数
多元回归方程中回归系数的经济意义是:y对自变量xi的回归系数bi是在其它所有因素都不变的情况下,xi变化一个单位时,y的平均变动量。因此回归系数的绝对值愈大,愈说明该因素重要。但是直接比较回归系数来判断因素对估计量y影响的显著性是不行的。因为回归系数的大小与自变量所取的计量单位有关。为了消除这个影响,就需要计算Beta系数(亦称标准回归系数),其计算公式:
![]()
β与y及xi所取的计量单位无关,因此它的绝对值愈大,该因素就愈重要,相应的因素对估计量y的影响就愈大。
用Beta系数判断回归分析中因素的主次关系比较直观,但这种方式方法只有当各自变量之间的相关性较小时才正确。如果在一个多元回归分析中所考虑的因素彼此之间有很密切的关系,应用这种方法反而可能得出不正确的结论。
3.偏回归平方和
设ui为回归因子x1的偏回归平方和,其计算方式为:

其中:cii是矩阵c=(X′X)-1中的对角线的元素。
凡是偏回归平方和大的那些因素,一定是对估计量y有重要影响的因素,ui愈大,该因素对估计量y的影响作用也就愈大。
4.t检验统计量
在多元回归分析中,为了从回归方程中剔除那些次要的,可有可无的变量,建立较为理想的多元回归方程,就需要我们对每个自变量xi进行考察。事实上如果某个自变量xi对估计量y的作用不显著,那么在多元回归方程中,就相当于它前面的回归系数bi可以取值为零,换言之即剔除了这个自变量。因此,检验自变量xi对估计量y的影响是否显著,相当于假设检验H0∶bi=0。
所采用的检验统计量称为t的检验统计量,其计算公式为:

式中:Q=Σ(y-yc)2称为剩余变差,m为多元回归方程中自变量的个数。
若|t|<tx(tx可通过查表求得),
则说明通过显著性水平α的t检验,自变量xi在多元回归方程中不起什么作用,可以从回归方程中剔除。反之,则可保留。
以上我们粗略阐述了多元回归分析中主要因素选择的问题,以建立较为理想的多元回归方程。更深入的问题,有兴趣的读者可阅读数理统计专著的有关内容。
第四节 相关与回归的应用需注意的问题
相关与回归分析主要应用于统计预测和控制。有关预测与控制的方法,本书第九章将有详细的介绍。这里主要是说明一些在相关与回归的应用中,需要注意的几个问题。
一、回归分析中主要因素的选择
在回归分析中,我们常常面临的问题是如何判别在诸多因素中哪些是影响预测估计量(即因变量)的主要因素,从而在为数众多的因素中挑选对预测估计量影响较为显著的自变量,以建立较为理想的回归分析模型。
回归分析中主要因素的选择,仅凭直观的分析往往是不够的,因为自变量之间也会相互影响,有些自变量孤立地看,对因变量有作用,但其作用有时可能被其他自变量替代,使之在回归方程中变得无足轻重。
为了分清一组因素(即自变量)对被估计量(即因变量)影响的主次关系,我们介绍下面四项指标来进行判断。
1.偏相关系数
偏相关系数的计算在本章第一节已有介绍,一般来说,偏相关系数的编对值较大的那些自变量对估计量的影响也较大,可选择作为必需考虑的自变量。
2.Beta系数
多元回归方程中回归系数的经济意义是:y对自变量xi的回归系数bi是在其它所有因素都不变的情况下,xi变化一个单位时,y的平均变动量。因此回归系数的绝对值愈大,愈说明该因素重要。但是直接比较回归系数来判断因素对估计量y影响的显著性是不行的。因为回归系数的大小与自变量所取的计量单位有关。为了消除这个影响,就需要计算Beta系数(亦称标准回归系数),其计算公式:
![]()
β与y及xi所取的计量单位无关,因此它的绝对值愈大,该因素就愈重要,相应的因素对估计量y的影响就愈大。
用Beta系数判断回归分析中因素的主次关系比较直观,但这种方式方法只有当各自变量之间的相关性较小时才正确。如果在一个多元回归分析中所考虑的因素彼此之间有很密切的关系,应用这种方法反而可能得出不正确的结论。
3.偏回归平方和
设ui为回归因子x1的偏回归平方和,其计算方式为:

其中:cii是矩阵c=(X′X)-1中的对角线的元素。
凡是偏回归平方和大的那些因素,一定是对估计量y有重要影响的因素,ui愈大,该因素对估计量y的影响作用也就愈大。
4.t检验统计量
在多元回归分析中,为了从回归方程中剔除那些次要的,可有可无的变量,建立较为理想的多元回归方程,就需要我们对每个自变量xi进行考察。事实上如果某个自变量xi对估计量y的作用不显著,那么在多元回归方程中,就相当于它前面的回归系数bi可以取值为零,换言之即剔除了这个自变量。因此,检验自变量xi对估计量y的影响是否显著,相当于假设检验H0∶bi=0。
所采用的检验统计量称为t的检验统计量,其计算公式为:

式中:Q=Σ(y-yc)2称为剩余变差,m为多元回归方程中自变量的个数。
若|t|<tx(tx可通过查表求得),
则说明通过显著性水平α的t检验,自变量xi在多元回归方程中不起什么作用,可以从回归方程中剔除。反之,则可保留。
以上我们粗略阐述了多元回归分析中主要因素选择的问题,以建立较为理想的多元回归方程。更深入的问题,有兴趣的读者可阅读数理统计专著的有关内容。
![]() |
|
| 高级统计师选课中心 | |