计算,其中<3>定序变量---定序变量:(A)Gamma系数:一般用G表示,它适用于分析两个变量间的对等关系,即两个变量无所谓自变量与因变量之分。G系数具有消减误差比例的含义。
![]()
其值在-1到+1之间,既表示相关程度,也表示相关方向。式中同序对是指某个案在两个变量上的相对等级是相同的,异序对是指某对个案在两个变量的相对等级上是相反的。
G系数是分析两个等级序列的关系的,故又称等级相关系数,在社会研究中,它所涉及的往往是研究对象本身的的某两种特征间的等级关系。 在等级分布表中,有时两个个案分数相同,分不出高低,这是一般用两级的平均值作为这两个个案的等级。
表示仅在变量x上同等级的对数,
表示仅在变量y上同等级的对数,
表示在两个变量上都同级的对数。
、
、
叫做同分对,G系数不考虑同分对,而只考虑同序对与异序对。
大规模调查中资料的等级分布往往是用列联表的形式给出的,这时,同序对数量等于表内每个频次乘以其右下方全部频次之和,然后加总。而异序对数量则等于表内每个频次乘以其左下方全部频次之和,然后加总。
(B)
系数,与G系数一样,
系数也是等级相关系数,其值也在-1到+1之间,也具有消减误差比例的意义。不同于G系数的是,
系数测量的两个变量间的关系是非对称性的,即所测两个变量有自变量x与因变量y之分,因此,其计算公式:
![]()
当资料是以次数列联表形式给出时,同序对与异序对的数量计算方法同G系数,
等于列联表中的每个频次乘以它有面的所有同行频次之和,然后加总。
(C)斯皮尔曼等级相关系数(Spearman),一般用
表示。与G系数和
系数不同,斯皮尔曼相关系数不失考虑个案对在两个变量上的相对等级,而是考虑单个个案在两个变量上的等级差异,它在计算每个个案在两个变量上的等级时,不仅要做高低的比较,还要考虑等级的差异是多少。
以
表示第i个调查对象在两个变量上的等级差异
,
为它在x变量上的等级值,
为它在y变量上的等级值,N表示全部调查对象总数,则
,
取值在-1到+1之间。
斯皮尔曼等级相关是以没有相同等级为前提的,如果某些个案在同一变量的等级是相同的,且相同等级不太多时,可取其平均值。
<4>定距变量---定距变量:最常用的是皮尔森相关系数:用r表示,

其中,
是变量x的平均数,
为x变量的第I个观察值;
是y变量的第I个观察值。r值在-1到+1之间。
r系数要求调查对象的成对资料N
50而且两个变量的分布应近似于正态分布。r系数是测量的两个变量间对等关系的,并且,r的平方值具有消减误差比例的含义。在实际计算时,一般采用下属经过简化的公式:
变量x与变量y间存在线性关系这一假设,是r系数的前提,如果两个变量间的关系不符合线性相关的假设,用r相关系数进行分析就会犯错误。 分析两变量间非线性关系的相关比例测量法:测量一个定类变量与一个定距变量相关程度的,即因变量(定距变量)在自变量(定类变量)各值上的差异情况。两定距变量是非线性关系时,可将一个变量看作是定类变量,采取比例相关测量法分析,由于定类变量不具有数量大小的概念,故不存在是否线性相关的问题,因此两个非线性相关的变量关系分析可用相关比例测量法来测量。
<5>定类变量----定距变量:两个变量中,因变量为定距变量时,采用相关比率来测量两者间的相关程度。相关比率,又称eta平方系数,简写为
, 
其中,
是因变量y的平均数,
是在每个自变量值(
)上因变量的平均数。E=
,其值在0-1之间。
具有消减误差比例的含义。eta平方系数的计算公式可简化为
其中
是自变量值
的个案总数,N是全部调查对象总数。相关比例测量法基本上是用于分析非对称关系的,但要求并不严格。
<6>定类变量----定序变量:(A)用theta系数,简记为
,其值在0-1之间。
系数是专门用于测量定类变量与定序变量间关系有无和强度的,它测量的是变量间非对称关系,并且不具有消减误差比例的含义。(B)采用测量两个定类变量关系的
系数和![]()
