(4)寻找因果次序:前导变量的引入可以说是源于社会学研究中对因果次序的探寻。
,这里,A因素就是前导变量。前导变量的引入步实施自变量与因变量之间的关系消失,而是使它得到澄清。
举例:父亲的教育水平影响儿子的教育水平从而影响投票率。
检验一个变量是否为前导变量的具体做法是:注意检验这个变量能否满足下述三个统计上的条件,若能满足,则是前导变量,否则不是:<1>三个变量:前导变量、自变量、因变量,必须两两相关。<2>控制前导变量后,自变量与因变量的关系应不消失。<3>控制自变量后,前导变量与因变量间的关系应当消失。
(5)防止将真关系误判为假关系:两变量间真实关系不能表现是由于第三个变量的闯入抑制、取消或削弱了这一真实关系。这种使真实关系隐而不彰的或减弱的变量就叫做抑制变量。
举例:年龄抑制工人会龄与种族态度的关系。控制年龄后,会龄与种族态度的相关性表现出来。
一个抑制性变量在某种意义上是与外在变量相对应的。后者用于检验假设是否被当作真,他从假设两变量具有真相关开始,继而引入检验因素,此因素对原来的两个变量来说是外在的,假如发现原来的关系消失了,则称原关系是虚假的。而前者则用于检验镇是否被当作假,它从两个变量间无关系开始,然后引入检验因素,这个因素对原来的两个变量来说也是外在的,假如在每一个分表中出现了关系,则称原来的无相关是虚假的。
正像外在变量可以判断关系为假而无法断言关系为真一样,抑制变量可以判断关系为真却不能断定关系为假。但是外在变量虽不能判断两关系为真,却可以通过对多个外在变量的检验,加强它是真关系的信心。同样,抑制变量虽然不能判断两变量关系为假,但却可以通过对多个抑制变量的检验,加强它是假关系得信心。
(6)恢复变量间关系的真貌:歪曲变量是使两变量间真是关系扭曲、变形的变量,它既可以将真扭曲为假,也可以将假变为真,甚至完全改变一个关系的真实方向。因此,对歪曲变量的检验,能够将两变量间真是关系袒露出来,从而使研究者避免抛弃正确的假设或接受错误的假设。
- 条件关系的分析:在利用分表发对分表中的关系与原关系进行比较时,我们发现这些分表中的关系或减弱、消失;或维持原状;或从无相关到有相关、弱相关到强相关;或与原关系的下相关方向相反。在这些情形中,我们假定所有分表中关系的大小与方向是相似的。但是,在有些情况下,各分表中的关系可能并不一致,即有的分标关系强、有的弱,有的分表是正相关,有的是负相关。在前一种情况下,由于所有分表中自变量与因变量的关系都相同(或相似),因此可以说这一关系是普遍的、无条件的。而在后一种情形中,自变量与因变量的关系因表而异,也就是说这一关系是有条件的,因此,我们称其为条件关系。这里所说的条件,可以是检验因素的不同分类、不同层次、不同阶段,以及任何具有分类意义的东西。
条件关系在社会学分析研究中作用很大,不仅可以帮助解释,对理论的建立做出贡献,还能说明、澄清两变量间的关系,促进对事物的了解;而且他对科学的主要目标之一:预测,也有重要贡献;它使得调查资料的分析更丰富、更深入、更正确。
(1)帮助解释:<1>促进修正原解释或发现新解释。<2>支持或强化原解释。<3>帮助选择正确的解释。对同一个现象,人们常常做出各种不同的解释,这些解释似乎都同样令人信服,都同样切合结果,使人难辨真伪。条件关系的检验往往能帮助分析者摆脱这种困境,选择恰当、合理的解释。<4>帮助发现隐而不彰的事实。在虚假无关中,由于各个分表中的关系方向相反,因而可以用两种方式进行解释。第一,分别解释,也就是对正关系与负关系各自做出解释。第二,整合的解释,即将两种对立的发现融合起来,只给出一个搞抽象层次的解释。<6>帮助了解事物发展趋势或过程。具体做法就是将时间作为检验因素。在横剖研究中调查资料大多是于某一时点或某一段时间收集到的,将他们用于社会动态研究颇受限制,但如果善于运用条件关系,就能在相当程度上解决这一困难。
(2)对关系进行说明、澄清及描述:所谓说明一个关系,就是将分表里具有特殊意义的关系指出来,并且指明这种特殊的意义。<1>清除原关系中的干扰因素。<2>明确指出加强或抑制原关系的一些条件。<3>可以说明两变量关系成立的必要条件。一般说来,所有的关系都是条件关系,即每一种关系都是在某种条件之下才成立。但通常研究中并不特别指出关系成立所应具备的条件,因为一般情况下他们的存在是内含的、公认的。然而在某些情况下,若能说明一个关系的同时,指出这种关系成立所必需的条件,则会增加人们对研究对象的深入了解,也使分析更加完整,条件关系可以完成这一使命。<4>条件关系可澄清自变量与因变量的本质。为进行实证的社会研究,必须将概念操作化,变成具体的指标或指数,然而这些指数与指标往往并不能精确代表概念,因此在解释指标时,常常超过或达不到这个指数或指标的范围,从而做出错误的解释。条件关系有时可以帮助分析者澄清调查资料所表现的指数的意义。<5>条件关系还可以使描述性的说明更精确。
- 联合作用的检查:将第三个变量作为一个自变量,以了解它与原来的自变量以怎样的互动方式对因变量产生作用。这种作用就是联合作用。它包括四种类型: (1)独立作用:如果将两个变量X与Y间的不对称关系用
表示,引入第三个变量A,将其视为自变量并假设A与Y也存在着非对称关系,则变量间的关系就变成
。X与A对Y的作用可分为: <1>两个自变量在不受对方作用的下对Y的独立作用。<2>X与A对Y的共同作用。<3>X与A形成新的变量后对Y的作用。
独立作用又分为两种情况:第一,两自变量之间彼此无关,各自独立的对因变量起作用。 第二,两自变量彼此密切相关地对因变量发生作用,每一自变量在一定程度上反映着另一自变量。
(2)相对作用:假定每个自变量军对因变量有独立的影响,那么何者大?这就是所谓相对作用的问题。相对作用研究在社会学研究中有着极为重要的作用,许多理论问题可以从检验相对作用的大小获得解决。如:是教育还是经济对个人的生育行为影响大?
(3)累积作用:是指两个自变量对因变量Y的共同作用,这种共同作用并不一定是两个自变量各自影响力的单纯相加,决定其强度的因素很多,但其中以两自变量间的相关程度为最重要。累积作用的大小主要决定因素是两自变量间的相关程度。
(4)类型作用:有时两个自变量或其中某一自变量与因变量并不相关,然后当它们融合在一起时,却能够产生另外独特的作用,这种情形相当于两个自变量融合之后形成一个新的自变量,它是超于组成它的两个单个自变量之上一个新的实体为与原自变量区别,我们称这种变量为“类型”。“类型”与各个自变量的关系就像整体与部分的关系部分组成整体,但整体性质不等于个部分之和。
按自变量的融合方式,“类型”可分为四种:<1>特殊类型:指新生成的自变量的涵意不同于原来两个自变量的涵意。<2>修正类型:指新合成的自变量修改了原自变量的本质与特性。<3>一致---不一致类型:指新自变量由两个性质一致或两个性质不一致的自变量合成。<4>相对的类型:指通过两个自变量相互地位的比较所产生的新变量。
由以上介绍可见,详析过程式统计分析与理论分析密切结合的过程研究者不仅要运用缜密的逻辑推理,而且要运用理论的洞察力和想象力对调查资料中所反映的客观事实或现象间关系做出理论解释。因此,在现代社会调查中调查研究人员不仅要努力掌握先进的统计技术,而且更重要的是要掌握科学的思维方式和推理方法,提高对社会现象的分析能力和洞察力。
- 调查分析的策略: (1)详析的程序: <1>确定两变量间关系的类型。若两者相关关系较显著就要进一步分析它们之间的是对称关系、还是相互关系或因果关系,如果是相互关系,我们则要进一步检查其相互影响,比较两者谁是更具持久性和固定性的变量,以尽可能决定影响的主要方向。如果是因果关系,则要确定谁是自变量,谁是因变量。 <2>确定关系的真伪。分两种情况:(A)两变量统计相关:应考虑这种关系是否有内在的或有意义的关系是否受到某外在变量影响的结果。(B)两变量统计无关或相关不显著:要看其关系是否被抑制变量所抑制,特别是在理论和实际观察都表明他们有可能有关系时。当量变量间的原关系的方向与我们所了解的和理论所提供的方向相反时,就要考虑是否歪曲变量在起作用。 <3>将量变量间的关系具体化。确定两变量关系为真之后,则可检查内含变量,以使这一关系更具体。 <4>寻找变量间的因果链。进行中介变量的检验,目的是对这一关系做出说明。有时,我们可以进一步通过追寻前导变量来扩大因果链条。 <5>检查是否存在条件关系。许多有价值的资料都是由这一步骤获得的。 <6>进行联合作用的考察。进一步考察两两个变量是否存在独立作用。如果两变量彼此独立起作用时,就要进一步考察两者何者为大,此外还要考察累积作用。最后可检查两自变量是否可以建立一个新的变量类型。
需要特别指出的是:在调查分析中,两变量关系只是代表分析的开始,而非结束。实际上在详析的过程中,每一部的分析都会得到一些结果,这些结果会产生一些新的问题,需要进行进一步的分析。分析是一个不断探寻的过程,每一步分析都会产生一个新的问题,而须检验新的资料,进行新的分析,新的资料又产生其他问题,如此循环反复就使得我们对于调查资料的利用更加充分并进而导致对社会现象的认识不断深化。
(2)假设检验与概念追踪:在调查研究中,虽然假设检验具有极大的价值,但它并不是唯一的,有时甚至不是最主要的一种方法。这是因为即使假设是由理论抽离出来的,也能获得资料的支持,但资料并不能证明理论,资料只能给理论以支持,虽然研究的发现与假设所根据的理论一致,但这些发现也可能与其他理论一致。实际上,经验研究远远超出了检验理论的被动功能,它不仅仅是证实或反驳假设。如果能适当的运用其他一些分析的策略与技巧,经验研究在创造、改进、反思和澄清理论上也能发挥积极的作用。许多调查分析采用一种所谓“概念追踪”的分析方法,它是一个理论与资料动态地交互作用的复杂过程。概念追踪与纯粹假设检验模型不同。假设检验是由理论起,理论发展出假设,收集相关资料,然后检验假设一决定其是否获得支持或否定。概念追踪则是在理论与资料间进行互动,它由资料出发,资料常迫使理论家进一步对其加以解释,而这些解释与理论又指引适当的资料以进一步验证理论或使理论更为周密。
(3)偶然重大发现的利用:科学的历史充满了未曾假设的意外发现。实际研究中,这种以偶然或智慧获得发现极为重要,因此对于这种偶然性发现的警觉是研究策略的关键要素。这种意外地发现可以促使产生新的理论或对原有理论作出修正。有时意外发现的贡献不一定是突破性的,但对于资料的意外可能性保持高度警觉,研究这就能够更充分的利用这些资料,并增进对社会学理论与知识的贡献。
(4)证据的分析:任何科学的目的是达到概括论断,即由具体的事物得到一般的原则或模式。概括论断可分为两类:经验的与理论的,前者是指根据一些个案所得到的结果概推到较普遍的总体。而后者是指从各种不同情况中得出一般原则,在这种概括论断中,具体的变量被看作是较抽象的概念的一个指标。 由经验得到概括论断,应进一步加以确证,以增加他的可信度和解释力。对于经验型概括一般是通过复验进行证实的, 复验的主要方法有: <1>将资料与来自同一或可比总体的其他样本作比较。<2>在不同的总体中作相同的经验性概括论断。<3>配对比较方法。
证实理论性概括论断的基本方法是选择代表同一概念的不同指标。杜尔克姆对自杀的分析提供了整理证据的卓越例子,他将许多经验性概推整合成单一的理论性概推,即高度的社会整合与低自杀率相关。将相同命题的证据累积起来就使其论点特别有说服力。需要指出的是,在验证理论性概推时,对于同一个研究与理论命题相关的一切资料都需要加以检查,而不能任意进行选择。
证据分析对于理论性概推的主要贡献主要有以下几点:<1>可以支持对结果的解释,由此可以产生更强有力和更有包容力的理论概推。<2>可以对某一理论的解释提出问题,从而使我们注意寻找更符合事实的其他解释。<3>可使在对原有结果的不同解释间作出正确的解释。<4>可在同一研究中进行验证,经验的概推除“配对比较”外,不可能在同一研究中对自身的结果进行验证。<5>有时能使我们对理论概推比经验概推在统计上更有信心。
(5)事后解释:是先有资料,然后再找符合它的解释。因此事后解释只是一种可信性的解释,而无法达到“证据确凿”的解释(高度肯定),即这种解释知识与一套资料相符而已。
事后解释的三大缺陷:<1>伸缩性过大,即对一种调查结果,可有多种解释。<2>不能将其完全抛弃。<3>无法以来外在的确证。事后解释因为是有了资料后才加以解释的因此无法肯定这一解释的正确性我们无法再检查资料以获得确证。
对于上述三大缺点,我们可以通过详析程序和证据分析程序部分加以克服。这两个程序都是由解释抽取出推论,然后将其付诸验证。因此,事后解释并非分析的结束而只是它的开始。社会调查研究中不得不使用事后解释,但在使用这种方法时,必须注意他所具有的局限性,必须运用上述的程序对他们进行处理。
第十七章:多元分析概论
- 多元分析的一般概念:(1)详析模式与多元分析:控制多个变量的方法与控制一个变量的方法一样,也可采用分表法,只是分表的层次更多而已。实际上,当变量数目超过4个时,由于表的层次过多、过大,使用这一方法是很困难的,特别是当要从一组因素去确定一定数目的变量,而且希望分析这些变量之间的关系时,困难就更大。为解决这一困难,所用办法是将上述的逻辑程序倒转过来,即“不摸索着去推断数据的结构性质”,而是先提出某一结构的假设,然后考察这个结构是否真正符合数据。
(2)多元分析的类型和应用:<1>类型:(A)美国库利和柯尼斯按变量的组数和群体数分为下述四类:因素分析,复相关、偏相关和典型相关;多因方差分析;判别分析和聚类分析。(B)英国统计学家根据研究目的将多元分析方法分为两大类:相依性分析和互相依性分析。回归分析、判别分析、典型相关分析均属于相依性分析,他们的共同特点是分析所涉及的变量是不平等的,即有自变量与因变量之分。相依分析的目的在于分析多个变量对某个或某些变量的共同影响或相对效应。互相依性分析所涉及的变量是平等的,分析的目的是变量之间的相互关系,以简化这种相互关系。因素分析、聚类分析等均属于互相依性分析。
每一种多元分析方法都是建立在一些列假设前提的基础之上的,这些假设既包括这一方法所涉及的变量的测量层次,而且也包括这些变量间相互关系的性质,以及资料的不同来源等。因此,在选择一种多元分析方法时,应首先考察这一方法所要求的前提条件是否得到满足,若某些条件未获得满足,就要想办法进行某种统计处理,例如定类变量,可先将其变为虚拟变量后再引入回归模型。
