袁方《社会学方法教程》笔记总结(23)

袁方 免费考研网/2009-01-06


<2>复相关:不是在对某一变量的众多因素中区别出某个变量的单独作用,而是用一个统计值来测量多个变量对一个变量的共同作用。复相关系数用符号:表示,在r下标的点前面是被作用变量的名称,点后面的是作用变量的个数与名称。复相关系数值在0到1之间,其平方值称为决定系数,具有消减误差比例的含义。其原理是线引入变量,以其来尽量解释y,然后再引入,以其尽量解释所剩余的误差,然后再引入依此类推,则所代表的是对y的最大解释,其平方根,即复相关系数,就是各个x与y的最大相关。
复相关也要求所有变量均为定距变量,其相关系数的计算也是以皮尔森相关系数为基础的。两变量()与某一变量(y)的复相关系数为:,将偏相关系数的值按上面所讲的公式带入本式,可得:其中为变量两两全相关系数。同理可得三个变量()与某一变量y的复相关系数计算公式:。即每高一阶的复相关系数可以低一阶复相关系数为基础计算出来。
当变量不全为定距变量时,要进行复相关分析,必须先将定序或定类变量转换为一组虚拟变量。转换的方法:如果是一个二分变量,则只要将赋予其中一值
1分,另一值0分,这一定序或定类变量就转变为定距变量了。统计学上将这种由非定距变量通过赋值0与1两值而变为定距变量称为”虚拟变量”。虚拟变量因为是定距变量,因而可以运用复相关分析。
<3>典型相关:是一种分析两组变量之间的相关关系的方法,它所测量的是两组变量的最大相关。其基本原理是利用标准化直线方程分别将每组变量组合为一个典型变量,然后计算这两个典型变量的相关。例如有5个x变量与3个典型变量,其对应的典型变量是:其中表示变量的贡献;表示变量对其典型变量的贡献。
建构典型变量的准则是使两者间的相关系数最大,称为第一典型相关系数。因此,典型相关就是两组变量的线性组合的最大相关。应当指出的是,因为每个变量组都有多个变量,第一典型变量不能完全解释所有误差,故而还应做第二次组合,这次组合的准则是:(A)第二对典型变量的相关也是最强的。(B)第二个典型变量与第一个典型变量无关,即。由此可得第二个典型相关。同理可得第三对典型变量和第三个典型相关。
典型相关要求所有变量均为定距变量,典型相关系数值在0到1之间,其平方值具有消减误差比例的含义。显然,当两组变量中某一组变量的个数为1时,典型相关就是复相关。
当资料是由概率抽样调查获得的,则无论是偏相关系数、还是复相关系数或是典型相关系数均要进行假设检验。
(2)多元方差分析:是对多个定类变量与一个定距变量关系的分析,他是由相关分析到因果分析的一个过渡。多元方差分析与一元方差分析的原理一样,都是将总方差分为两部分:消减方差和剩余方差,通过计算F值和相关系数E的值来检验和测量定类变量对定距变量的作用。不同的是,多元方差分析定类变量的数目增多,因此分析内容较多。
(3)多元因果分析:通常采用建立因果模型的方法,所谓建立因果模型就是利用统计手段将变量间的因果关系用一个或一组数学方程式表达出来。在社会研究中因果模型受到高度重视,主要原因在于它与实际估计模式参数的方法论结为一体,从而为人们提供一种以高度可读性因果图表去表述理论的手段。因果模型所用技术一般具有某种可对理论进行检验的、精确严格的假设式演绎方法。最著名的因果模型是多元线性回归分析模型。此外还有路经分析模型和对数线性分析模型等。在这些模型中因果关系一般是某一特定时间内个体单位数兴建的一种非对称关系,而不是一定时间内有序时间的相互关系。
<1>多元线性回归:它是社会研究中多个变量之间数量关系最简单的表达方式,是研究两个或多个自变量与一个因变量之间的线性关系的方法。所谓线性关系是指定量表达式的各项之间是可加的,所以这种表达式又叫做线性可加模型。其中:为y轴的截距。为当保持不变时,变化一个单位,的变化量。其他类推。称为偏回归系数。为当一定取值时,随机变量y的平均数。
多元线性回归出要求自变量间的关系是线性可加的之外,还要求所有变量均为定距变量。和相关分析不同,不得将一组虚拟变量均引入回归方程,必须放弃其中一个虚拟变量,否则回归系数无解。
根据抽样数据建立的多元线性回归,必须经过F检验,以确认回归直线以及每一个自变量偏回归系数的建立。由于抽样误差的可能性不会大于给定的显著性水平,从而以最大的限度保证了所建多元直线方程和偏回归系数的可靠性。
在多元直线回归中,我们要计算复相关系数,即全部自变量与因变量的相关程度。决定系数表示使用所确立的多元线性回归方程解释y时,所能减少的误差的比例,其值越大,表示多元回归对y的解释力越强。
决定系数是鉴别多元线性回归方程品质的一个非常重要的指标,如果决定系数过小,表示在所使用的回归方程中很可能遗漏了某些重要因素。在此情况下,不仅表示所选择的自变量意义不大,而且很可能破坏了使用多元线性回归的假定,从而使所求得的偏回归系数有误。但也不能由此采用相反的做法,即引进的自变量多多益善。实际上如果引进了许多与y无关的变量或彼此间相关性很强的自变量,都会引起所求回归方程偏回归系数的失真或甚至无解。为了判别在多元线性回归中应引进哪些自变量,那些自变量更重要,从而应先引入方程,常采用逐步回归的方法。但是任何一种统计技术或计算机程序都是由人去操作运用的,他们不能代替人的思考。只有当对现象的本质和内部联系有了一定的认识之后,才能考虑某种确定的统计工具。否则,轻率的选择某种统计工具,或者干脆靠计算技术出来代替分析,所的结论都是不可靠的,甚至是危险的。
多元线性回归除了适用于多个自变量的情况外,还适用于虽然自变量只有一个,但它与因变量的关系却是非线性的。例如:即x与y的关系是一个多项式的关系。实际上,只要将、当作不同变量,就可以将上述多项式回归转化为k元线性回归。
回归分析不仅在横剖因果研究中得到广泛应用,同样在纵贯的时间系列分析中也有广泛的应用。把回归分析运用于社会分析时,还要注意因果联系中的滞后效应。
<2>逐步回归:它不是首先建假想模型,不是一次将我们认为对因变量有影响的因素作为自变量引入回归方程,而是逐步引入,若引入的自变量对因变量有显著影响,就将其保留;反之则将其去掉。这样,最后得到的回归方程之中只包含那些对因变量作用显著的自变量,而未引入回归方程的其余因素,增加任何一个对回归效果都没有显著的改进。
逐步回归的具体步骤是:
(A)确定有可能影响因变量y的自变量,假定在某项研究中我们确定了5个自变量。(B)计算每个自变量与y的皮尔森相关系数,然后从中选出与y相关性最强的自变量引入方程,假定最大,则应被引入回归方程:即(C)逐一考虑其余变量与已被选入回归方程的变量对y的共同作用,即计算复相关系数,并从中选出相关最强的自变量进入回归方程,假若最大,则应被引入,得到二元线性回归方程:。(D)同第三步一样,逐一考虑其余变量与被选入变量对y的共同作用,再从中选出复相关最强的自变量进入回归方程,依此类推。在每引入一个自变量后,都须进行F检验,以确定引入后回归方程对于y的解释是否显著增加,若达到研究所要求的显著度,则保留该步中引入的变量,否则将其舍弃。通过逐个引入自变量注册检验最后所得到的回归方程包含的都是对因变量作用显著的自变量,这些自变量的重要性与其被引入的次序相同,即最先引入的变量最重要,其次被引入的第二重要。显然,逐步回归中进入回归方程的自变量多个数多少与研究所要求的显著性水平有关。
逐步回归不仅可以从众多的自变量中找出一些最重要的自变量,从而使研究得以简化,而且当个自变量之间相关程度较高时,使用一般线性回归方程将会出现系数失真或无解情况,逐步回归通过自动的放弃一些变量,从而避免了上述问题。逐步回归可与一般回归混合使用。
<3>路径分析:一般回归分析和逐步回归分析都是研究多因一果型关系,路径分析则是对多层次因果关系的分析方法。
与一般回归分析不同,路径分析不使用一个而是用一组线性回归方程刻画多个变量之间的关系,对于各因变量的分析不仅要分析其受直接作用力的大小,也要分析其受间接作用力的大小。此外,路径分析也不同于逐步回归分析,它不是寻找一个有效的因果模型,而是以一个有效的因果模型为出发点,这一因果模型其实是一个内容复杂的假设,然后用资料验证这一假设。
<4>对数线性分析:由L.古德曼(Goodman)所首创,多用于自变量与因变量均为定类变量的多元因果分析。分析时先将数据制成列联表,再将列联表中所有格值分别取对数,这也也是本法称作对数线性分析的缘故。因为取了对数,各自变量对格值的影响就可以看成是线性可加的了,然后以各种模型与调查结果进行拟合检验,以确定最佳的模型分析。
对数分析不仅可对因变量每一自变量间的直接关系及美对自变量间的关系进行分析,更重要的是可对三变量或多个变量之间的关系,即对变量间的多种交互作用进行分析。
(4)判别分析:目的就是描述由几个已知类别得来的对象的差异性,试着寻找一”判别物”,依其将这些群体分离。在判别分析中,作为判别物的是由若干判别因子组成的线性判别函数:其中称为判别系数,表示各个判别变量的贡献,它是由过去的资料求得的。
判别分析中,判别变量均要求为定距变量。
128、 互相依性分析:目的是研究多个变量之间的相互关系,从中找出一个简单的结构。常用的方法有:(1)聚类分析:是一种分类技术,它是依据研究者的理论或对变量的实际相关情况将变量分类,然后测量这一分类方式是否有效。分类是人类认识世界最基础的手段之一,但在古老的分类学中,人们主要是依靠经验进行分类,聚类分析则是依靠科学的定量方法进行分类,因而更精确可靠。
在社会研究中,一个概念往往要通过一组指标(或变量)来进行测量,但这些变量往往并不是互不相关的,有些变量甚至呈现出很高的相关性,因此可通过聚类分析将变量聚合为若干类,从而使我们能更清晰地了解问题。聚类分析适合于各种测量层次的变量。

相关话题/

  • 领限时大额优惠券,享本站正版考研考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新考研考试考证类电子打印资料任你选。涵盖全国500余所院校考研专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是考研复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19