<2>优点和局限:多元分析较之于单变量和双变量分析能更真实反映复杂的社会现象之间相互联系与相互依存的关系,但其局限是:(A)大多数多元分析方法都是在分析前先形成一个假设,然后再探寻与资料的符合程度,因此多元分析大多是与事先的理论研究密切联系在一起的,这就要求研究者具备很好的专业训练。此外,选择何种理论假设模型是由研究者决定的,这就是它很难避免研究者主观因素的影响。
(B)多元分析是一种高级分析手段,一般要求变量具有较高的测量层次,在社会研究中这种要求往往很难达到。为此研究人员利用许多统计手段将这些低层次变量转化为定距变量处理,从而使多元分析的影哟国内范围得到一定程度的扩大
(C)多元分析一般要求每一项记录来自同一时点和同一单位,这在大规模的社会调查研究中也是难于保证的,这就为进行同一时点上地区差异的分析和同一单位的历史变化的分析带来了困难。
(D)多元分析包括了高深的数学问题并涉及大量的数字处理与运算,随着计算机技术的发展和统计软件包的问世,这方面的困难有了很大克服。但当变量的数目太多,或设备缺乏以及受过专业训练的统计人员不足时多元分析方法实际应用仍受到很大限制。
(E)多元分析常碰到一个问题是对于结果的解释。由于分析中变量的选择,使用的分析方法是因研究者而异的,而且由于多个变量间相互作用的复杂性等,使得对于分析结果的解释要较之于双变量和单变量分析更为困难。
- 相依性分析:
(1)多元相关分析:<1>偏相关:是指用一个统计值来测量当控制了其他变量的影响后,某一变量与另一变量间关系的有无和大小。根据控制的变量的数目,可以将相关分为:一阶段相关、二阶段相关、三阶段相关等等。 偏相关分析的要求:所有变量为定距变量,测量偏相关关系的统计值称为偏相关系数,其值由-1到+1。偏相关系数用符号
表示,在r下标点前面的是欲测偏相关的两个变量的名称,点后面是控制变量的个数与名称。例如,
表示控制变量Z后,变量X与Y的偏相关。为了简便起见,我们常把变量编号表示成如
的形式,这是偏相关系数中的变量符号仅用变量的顺序号表示即可,例如用
表示控制
后,变量
的偏相关。
一阶相关的偏相关系数:
,式中的
分别表示两个变量
的全相关,它就是测量两个定距变量相关关系的皮尔森相关系数。实际上它是偏相关系数的一个特例,即控制变量个数为零时的偏相关,故又称零阶相关。一阶相关的偏相关系数的计算是建立在零阶相关基础上的,这是与偏相关分析的原理分不开的。偏相关分析的目的是排除其他变量的影响,以测量两个变量间的“净关系”,式中
是为排除其他变量的影响时变量
对
的全作用,但这种作用中有一部分可能是另一个变量的作用所致,
分别表示
对
与
对
的影响力,则(
)就是从
对
的总作用中剔除
所造成的影响后的净作用。同理,二阶相关的公式:
。三阶相关的公式:![]()
偏相关系数也可用于详析分析,具体做法:
(A)计算x与y的全相关系数
(B)引入检验变量A,计算x与y的偏相关系数
。
(C)比较
与
,若
=
,说明x与y的关系不受变量A的影响;若
=0,说明x与y的关系完全由A引起;若
,说明x与y间的关系部分由A引起的。
分表法与偏相关系数法比较:(A)相同点:都是利用统计控制区除其他变量的影响,以揭示两变量统计关系的真伪,进行更深入的因果分析。(B)不同点:分表法适应于各种类型变量,除可对变量关系进行检验外,还可进行条件关系分析和联合作用分析。缺点是当类别很多、表很大时,这种直观分析方法困哪较大,而且为了保证分表中每个单元有足够的案例,需要的样本规模也较大。偏相关系数在这两个方面优于分表法,缺点是不宜于条件关系和联合作用的分析,应用范围受到限制。
若计算两个定序变量的偏相关系数,则采用Gamma系数。以一阶相关为例,具体做法:依据变量A的值将样本分组,然后分组计算个组中的同序对数
和异序对数
,则偏相关Gamma系数为:
,其中控制变量A可以是定序变量,也可以是定类变量。当控制变量为两个或更多个时,计算偏相关系数的公式是相同的
当变量x与y均为定类变量(或一个为定类变量、一个为定序变量)时,应当采用偏
(或偏
系数)。具体做法是:根据控制变量的值将样本分组,以每组个案数与样本所含个案总数的比例为权数,计算各个分组的相关系数值的加权平均数,即:
其中
是每组Lambda值,
是每组个案数,N为样本个案总数。
<2>复相关:不是在对某一变量的众多因素中区别出某个变量的单独作用,而是用一个统计值来测量多个变量对一个变量的共同作用。复相关系数用符号:
表示,在r下标的点前面是被作用变量的名称,点后面的是作用变量的个数与名称。复相关系数值在0到1之间,其平方值称为决定系数,具有消减误差比例的含义。其原理是线引入变量
,以其来尽量解释y,然后再引入
,以其尽量解释所剩余的误差,然后再引入
依此类推,则
所代表的是对y的最大解释,其平方根,即复相关系数,就是各个x与y的最大相关。
复相关也要求所有变量均为定距变量,其相关系数的计算也是以皮尔森相关系数为基础的。两变量(![]()
)与某一变量(y)的复相关系数为:
,将偏相关系数
的值按上面所讲的公式带入本式,可得:
其中
为变量
两两全相关系数。同理可得三个变量(
)与某一变量y的复相关系数计算公式:
。即每高一阶的复相关系数可以低一阶复相关系数为基础计算出来。
当变量不全为定距变量时,要进行复相关分析,必须先将定序或定类变量转换为一组虚拟变量。转换的方法:如果是一个二分变量,则只要将赋予其中一值 1分,另一值0分,这一定序或定类变量就转变为定距变量了。统计学上将这种由非定距变量通过赋值0与1两值而变为定距变量称为“虚拟变量”。虚拟变量因为是定距变量,因而可以运用复相关分析。
<3>典型相关:是一种分析两组变量之间的相关关系的方法,它所测量的是两组变量的最大相关。其基本原理是利用标准化直线方程分别将每组变量组合为一个典型变量,然后计算这两个典型变量的相关。例如有5个x变量与3个典型变量,其对应的典型变量是:
其中
表示
变量
的贡献;
