相关分析法

浏览

用于研究社会经济现象数量依存关系的一种数理统计方法。包括相关分析回归分析。相关分析是对两个对等的经济数列,用数学方法测定一个反映它们之间变动的联系程度和联系方向的抽象化数值,即相关系数。回归分析是在两个或两个以上有联系的经济数列中,确定一个为因变量数列,其他为自变量数列,为它们配合一定的数学模型(见经济计量分析),并用统计方法(如常用的最小平方法)估计模型参数,得出回归方程,作为根据自变量值估计因变量值的依据。一个因变量与一个自变量回归,称单回归;一个因变量与两个或两个以上自变量回归,称复回归。回归的表现形式有直线回归与非直线回归。回归估计是以给定的自变量值代入回归方程中求得估计的因变量平均值。这个平均值有误差,误差的代表值是估计标准误差。相关系数、回归方程和估计标准误差是相关分析法三个有密切联系的主要组成部分。最简单、最基本的相关分析法是两变量之间的直线相关和回归。

直线相关系数计算方法

xy为两个不分因变量和自变量的对等变量, n代表成对变量值数目,则相关系数r的算式为:

公式 符号

r值在+1与-1之间,其值越接近±1,表示两变量直线相关的程度越高,越接近零,则相关程度越低;正号r值表示两变量有同增同减的同方向变动关系,而负号r值则表示一增一减的异方向变动关系。

直线回归分析方法

直线回归的一般方程式是yc=a+b x,式中的x是自变量,y是因变量,称yx回归方程。在两变量互为因果关系(如身高与体重)的资料中,还可计算另一条对应的回归线:xy回归线,即xc=a′+by。在yx回归方程中,只能根据给定的x值估计平均的y值,而不能反过来给定y值估计x值;同样,在xy回归方程中,也只能根据给定的y值估计平均的x值,而不能反过来估计。在不是互为因果关系的资料(如每亩耕地施肥量与农作物产量资料)中,则只能计算一条回归线,进行单方向的估计。在yx回归方程中,用最小平方法估计参数ab的公式是:

公式 符号 公式 符号

直线斜率 b如为正值,表明两变量有正比变动关系;如为负值,则表明有反比变动关系。a是直线的截距。这条回归线的估计标准误差算式是:

公式 符号

xy回归线的a′、b′及S x算式同上,只是把xy互换即可。

应用相关分析与回归分析要注意两个问题:

(1)在资料上,相关分析要求两个变量都必须是随机的;而回归分析则要求因变量必须是随机的,自变量则不能是随机的,而是规定的值,这与在回归方程中用给定的自变量值来估计平均的因变量值是一致的。

(2)防止虚假相关和虚假回归。在对两个时间数列进行相关分析和回归分析时,常因各期指标值受时间因素的强烈影响而损伤了所需要的随机性;也有时两个时间数列表面上似有同升同降的变动,实际上并无本质联系。对这类资料求出的高度相关系数或回归联系,往往是一种假象。为此,在用相关分析法研究复杂的社会经济现象时,需要有科学的理论指导和正确的判断。