内隐联想测验【内隐联想测验新变式述评:基于规范性分析框架】

发布时间:2020-03-03 来源: 感恩亲情点击：

　　摘要：规范性分析详细描述了一个理想的、完美的内隐测验所应当具有的一系列标准和特征，通过对内隐联想测验的三个新变式在多大程度上符合这些规范性特征和标准的检验，发现相对于简式内隐联想测验而言，无再编码和单区组内隐联想测验更符合What标准和How标准，未来的研究应更多关注内隐标准。
　　关键词：规范性分析；简式内隐联想测验；无再编码内隐联想测验；单区组内隐联想测验
　　分类号：B841
　　
　　1、De Houwer内隐测验规范性分析框架
　　
　　内隐测验的规范性分析详细说明了一个理想的内隐测验所应当具有的一系列标准和特征，为评估和检验内隐测验提供了一个启发式框架。规范性分析标准不是一个内隐测验的最低标准，而是最终目标。因此，可以通过检验一个内隐测验在多大程度上符合这些规范性特征和标准来分析其优势和劣势。从而为未来的研究提供指导。
　　内隐测验的规范性分析标准包括三个：第一，内容标准(what criterion)。即有哪些心理属性导致了内隐测验的结果(因果内容)；第二，机制标准(how criterion)。即被测量的心理属性怎样导致了内隐测验的结果(因果机制)；第三，内隐标准(implicitness criterion)。即被测量的心理属性是否自动导致了该内隐测验的结果(因果自动)。因为同一个心理属性可能通过不同的加工过程对测验结果产生影响，而不同的心理属性也可能通过同一个加工过程对测验结果产生影响，所以What标准和How标准并不是完全分离的(De Houwer etal.，2009)。同时，本文涉及的都是内隐联想测验，并不会在内隐标准方面存在明显差异。因此本文只基于规范性分析的What标准和How标准来述评内隐联想测验的三个新变式。
　　
　　2、内隐联想测验新变式
　　
　　内隐测验是指在没有明确目标、意识、充足的认知资源或者充足的时间的前提下，由被测量的心理属性导致相应测验结果的一种测验程序(De Houwer,2006；De Houwer,Teige－Mocigemba，Spruyt，＆Moors，2009)。Greenwald，McGhee和Schwartz(1998)提出的内隐联想测验是内隐测验的一种，通过测量概念之间的自动评价(联结强度)来测量内隐态度。虽然内隐联想测验的提出只有十几年的时间，但是由于其操作简单、易于解释、信效度较好而得到了广泛应用，因此也出现了很多变式。主要有：无再编码内隐联想测验、单靶内隐联想测验、单属性内隐联想测验、单类别内隐联想测验、类聚焦内隐联想测验、单区组内隐联想测验和简式内隐联想测验等。由于已有一些研究评述内隐联想测验的有关新变式(例如，温芳芳，佐斌，2007；张珂，张大均，2009)，而且单靶内隐联想测验、单属性内隐联想测验、单类别内隐联想测验等均是为了解决传统IAT只能测量内隐联想的相对强度问题，因此，本文只对无再编码、单区组和简式内隐联想测验这三种新变式基于规范性分析框架进行对比分析。
　　2.1　无再编码内隐联想测验(The Reeoding－Free
　　Implicit Association Test，简称IAT－RF)
　　Rothermund，Teige－Mocigemba，Gast和Wentura(2009)提出无再编码内隐联想测验，以花和昆虫IAT－RF为例来说明其实验程序。IAT－RF分三个阶段，首先，进行16次属性词(积极／消极)效价归类练习(属性维度)；其次，进行16次目标词(花／昆虫)归类练习(目标维度)，不同类别任务随机呈现；第三，联合类别化任务，花和昆虫根据目标类归类，积极和消极的词根据属性效价归类，32次练习试验，128次正式试验，相容任务和不相容任务随机混合呈现。每次试验开始时，在屏幕左上角和右上角分别呈现四对不同的类标签，确保被试能够记清反应键，1000 ms后，为了再调整被试的注意点，屏幕正中心呈现了“十”字，500 ms后，“十”字被刺激词替代，直到被试做出反应才消失。如果被试反应错误，在刺激下方呈现错误提示信息“错，按正确反应键继续……”，直到被试做出正确反应才消失，同时类标签和刺激也消失，持续250 ms空屏后，下一次试验开始，整个实验大约持续15分钟。
　　2.2　单区组内隐联想测验(The Single－Block IAT，
　　简称SB－IAT)
　　Teige－Mocigemba，Klauer和Rothermund(2008)提出了单区组内隐联想测验，以花和昆虫SB－IAT为例来说明其实验程序。一条虚线把屏幕分成上下两部分，刺激随机呈现在屏幕上下部分。对于属性刺激词，无论刺激词呈现在屏幕中的上半部分还是下半部分，都对积极的词按右键反应，消极的词按左键反应；对于目标词，如果目标词呈现在屏幕上半部分，花类刺激按右键反应，昆虫类刺激按左键反应，如果目标词呈现在下半部分，则相反。整个实验过程由5个阶段构成，阶段一，对呈现在屏幕上半部分的目标词进行归类。阶段二，对呈现在屏幕下半部分的目标词进行归类。阶段三，目标词随机呈现在屏幕上下半部分，被试的按键反应由目标词呈现在屏幕中的位置来决定。阶段四，对随机呈现在屏幕上下半部分的属性词进行归类，按键反应不随属性词呈现在屏幕中的位置而改变。前四个阶段称为单任务试验区组。阶段五为联合任务试验区组，对随机呈现在屏幕上下半部分的目标词和属性词的联合进行按键反应，按键反应由刺激词呈现在屏幕中的位置来决定。所有试验区组在正式试验前均有2－4次热身试验，总共8次热身试验，48次单任务试验，48次联合任务试验，类标签一直呈现在屏幕上以起提示作用。
　　2.3　简式内隐联想测验(The Brief Implicit
　　Association Test，简称BIAT)
　　
　　Sriram和Greenwald(2009)提出的BIAT是目前对传统IAT的最新修正，以花和昆虫BIAT为例说明其实验程序。传统IAT包括四类刺激材料，例如“花、昆虫，积极、消极”四类词，其中每类词对应两个反应键中的一个。而BIAT要求被试在每个联合任务中只集中于四个“类别－反应”对(花－左键　积极－左键　昆虫－右键　消极－右键)中的两个。在每个联合任务前，两个类别的标签和材料同时呈现给被试，要求被试牢记材料的所属类别，并对这两个类别指定反应键，称之为“焦点(focal)”键，而对其他材料执行“非焦点(nonfocal)”键。BIAT由两部分联合任务组成，每部分任务都包含两个焦点类别材料，例如，在一个试验区组中以积极和昆虫为焦点，那么在另一个试验区组则以积极和花为焦点。因此，“积极”在这两个试验区组中均作为焦点，另一个类别“消极”则一直是非焦点。BIAT圆括号中的词代表其在试验中始终作为非焦点的类别，如花一昆虫／积极(消极)，刺激列的顺序代表分数所指的评价意义，高成绩表示第一列和第三列之间的联想强度更大。例如在“花一昆虫，积极(消极)”BIAT中，分数大于0则说明“花(第一列)和积极(第三列)”之间的联想强度大于“昆虫和积极”之间的联想强度，同理，如果是“昆虫一花，积极(消极)”分数大于0则说明“昆虫和积极”之间联想强度大于“花和积极”之间的联想强度(争晋，2010)。
　　
　　3、基于规范性分析框架对三种新变式
　　的评价
　　
　　3.1　传统IAT的方法特有变异(method－specific
　　variance)及应对
　　内隐联想测验规范性分析的内容标准规定IAT效应只能由态度、刻板原型等心理属性在记忆中的联结强度的差异所导致，而不是由其他的无关变量所致。机制标准阐述了被测量的这些心理属性如何导致了内隐测验的测验结果。由于What标准和How标准并不是完全分离的，很难严格区分，本文也不做这种区分。大量的研究(包括实验研究、准实验研究和相关研究)表明IAT效应至少在某种程度上是由态度或者刻板原型等心理属性所导致的，但是需要注意的是：第一，这种IAT效应是相对而不是绝对的(Greenwald＆Nosek，2001；Greenwald，Poehlman，Uhlmann，＆Banaji 2009)。第二，仍有其他的心理属性或者情境因素可能混淆IAT效应，包括：个人的额外知识或者社会观点(extrapersonal knowledge orsocietal view)(Han，Olson，＆Fazio，2006；Karpinski＆Hilton，2001)，刺激的知觉突出不对称性(salience asymmetry)(Greenwald，Nosek，Banaji，＆Klauer，2005)，刺激和类别的知觉和情感相似性(similarity at the perceptual and affectivelevel)(De Houwer，Geldof，＆ De Bruycker，2005)，个体基本的认知能力(cognitive abilities)等。这些混淆IAT效应的因素被Teige－Mocigemba等人(2008)称为IAT方法特有变异。研究者提出了很多技术来消除方法特有变异对IAT效应的混淆。Back，Schmukle和Egloff(2005)以及Mierke和Klauer(2003)认为可以把任务转换试验从分析中剔除从而消除方法特有变异。Greenwald，Nosek和Ban aji(2003)认为可以通过改善得分算法(进行数据转换，即把原始分数转化为D分数，类似信号检测论中的D分数)部分减少方法特有变异的影响。Klauer，Voss，Schmitz和Teige－Mocigemba(2007)提出的IAT分析的扩散模型(diffusion modelanalysis of the IAT)能够分解IAT效应中方法特有变异(construct－specific)。Conrey，Sherman，Gawronski，Hugenberg和Groom(2005)提出的方阵模型(quad model)能够辨别四个成分对IAT效应的影响。但是这些方法都不能从根源上消除方法特有变异对IAT效应的混淆。
　　传统IAT程序是包含相容任务和不相容任务的双区组结构，在相容任务试验区组中，再编码策略可以把IAT复杂的4－2归类任务简化为单独的二分决策任务，即目标和属性刺激都可以只根据属性来归类，但在不相容任务试验区组中这种再编码策略则不起作用，因此，这种再编码效应混淆了IAT效应(Teige－Mocigemba et al.，2008)。再编码策略有广义和狭义之分，狭义的再编码策略是指被试对呈现的属性刺激或目标刺激不是根据IAT所谓的“名义上的类别”(nominal categories)进行归类的(Rothermund et al.，2009)，广义的再编码策略不仅仅指根据属性重新构造目标类别，而是包含任何允许把一个目标类和属性类简化为一个反应的策略都可以看作再编码，完全和类别无关的结构或感知觉特点(例如突出不对称性)也能够再编码，混淆IAT效应(De Houwer，Geldof,＆De Bruycker，2005；Rothermund，Wentura，＆De Houwer，2005)。
　　因此，IAT方法特有变异主要是由于传统IAT程序的双区组结构导致被试能够采用再编码策略从而混淆了IAT效应，如果有效地控制再编码策略就能避免这些因素对IAT效应的混淆，IAT－RF、SB－IAT和BIAT分别从不同的角度消除再编码加工过程。
　　3.2　基于内容标准和机制标准对三种新变式的
　　评价
　　3.2.1　对IAT?RF的评价
　　IAT－RF是为了消除再编码对IAT效应的混淆而提出来的，是通过修改传统IAT的试验区组结构来消除再编码效应。它把相容任务和不相容任务安排到单一试验区组中并随机呈现，通过屏幕上的类别标签来指导反应。研究结果表明IAT－RF能有效地阻止再编码加工过程，能够检测任务目标名义类别的内涵(Rothermund et al.，2009，)，因此IAT－RF效应反映的是任务的名义目标和属性类别之间的真正相容性。由于传统的IAT效应不是真正相容性的无偏估计，容易受到个体差异(如不同基本认知能力的个体，再编码能力也有差异)的影响，因此传统的IAT效应不适用比较不同个体间IAT效应的差异，而IAT－RF中的相容性效应是对真正相容性的相对无偏估计，因此可以比较不同个体或者群体之间的差异。同时，IAT－RF效应不受外显偏好再编码的影响，特别适用于预测被外显偏好低估了的行为。最近的研究也证明了IAT－RF对政治态度、双重行为(ambivalent behaviors)(如吸烟(Teige－Mocigemba et al.，2008)和饮酒(Houben＆Wiers，2007a，2007b))的预测效度。但是需要注意的是IAT－RF只是减少并没有彻底消除再编码效应，因此IAT－RF效应并不是对真正意义上的纯IAT效应的评估。
　　3.2.2　对SB－IAT的评价
　　SB－IAT也是试图通过修改传统IAT的结构从而从根源上消除方法特有变异。研究结果表明，在没有降低信度和效度的前提下，SB－IAT结构上的改变消除了区组结构，减少了方法特有变异对IAT效应的混淆。除此之外，SB－IAT还有一些优点：第一，消除了相容性顺序效应(compatibility－ordereffects)，即如果相容性区组先于不相容性区组呈现，IAT效应就较大，反之则IAT效应较小。第二，减少了个人额外联想(extrapersonal associations)，即某个人对某事物的评价和一般人的评价不一致，例如一般认为苹果是有助于身体健康的，因此是积极的，但我不喜欢苹果，对其评价是消极的。个人额外联想对IAT效应的混淆是基于IAT的区组结构，SB－IAT消除了区组结构，因此也消除了个人额外联想效应。第三，消除了刺激情感效价改变带来的影响(Teige－Mocigemba et al.，2008)。SB―IAT也存在一些不足：第一，结构复杂，即使大学生被试想要又快又准确完成实验任务也有一定的难度。第二，除了任务转换(task－set switching)，又新引入了相容反应和不相容反应转换(switchingbetween the compatible and incompatible responsemappings)，但是这两种类型的转换对相容性反应和不相容性反应的影响是一致的，因此虽然增加了误差变异，并没有混淆IAT效应。
　　3.2.3　小结
　　IAT－RF和SB－IAT都是通过消除传统IAT的双试验区组结构来减少再编码对IAT效应的混淆，因此二者在理论本质和实验程序上并没有真正的区别，未来的研究应该关注二者分别在哪些情况下更有效。就结构而言，SB－IAT的结构更清晰，词呈现的位置就表明了每次试验的反应映射，而IAT－RF中，被试每次试验都需要阅读类标签才能，知道反应映射，因此加大了实验难度，增加了系统误差，降低了测验信度。但是SB－IAT的结构特征容易被被试误用而简化分类任务造成混淆。另外，IAT－RF和SB－IAT也存在一些问题：第一，引进了可能混淆IAT效应的因素：一是相容性和不相容性映射之间的转换，二是词呈现位置和相容性之间的混淆。第二，更为重要的是IAT－RF和SB－IAT试验结构上的改变有可能导致被试在内隐标准方面出现变化。
　　IAT效应反映的是多种不同因素效应的“聚合物”，其中一些因素和IAT所要测量的结构无关。从目前的研究来看，消除或者减少混淆IAT效应的策略主要有两种：一是从IAT效应中抽取与IAT所要测量结构相关的部分变异，例如扩散模型和方阵模型；二是消除传统IAT的双试验区组结构，例如IAT－RF和SB－IAT。研究证明IAT－RF和SB－IAT在满足了心理测量学特征的同时又有效地消除或者减少了IAT效应的混淆，确实能够减少或者消除任务转换消耗、知觉突出性、相似性、策略效应和人际间联想、方法特有变异和刺激的知觉不对称性等对IAT效应的混淆，但是这些因素对IAT效应混淆的程度仍然需要研究，可能IAT－RF、SB－IAT和扩散模型、方阵模型分析的结合才是解决问题的有效方法。
　　3.2.4　对BIAT的评价
　　Sriram和Greenwald提出BIAT作为目前对传统IAT的最新修正，是通过联想聚焦(associativefocus)策略来消除再编码加工过程对IAT效应的混淆。
　　BIAT和传统IAT的区别在于：第一，BIAT使用的指令更为简化，耗时显著减少，而传统IAT通常需要5个试验区组，包含180个甚至更多试验，第二，BIAT加入了焦点类别和焦点反应键，要求被试聚焦于四类中的两个，使被试产生预期注意而对焦点类别判断的反应时和错误率小于非焦点类别，同时，焦点式的加入充分控制了被试在反应过程中的有意识加工(Sriram＆Greenwald，2009；晋争，2010)。BIAT的指导语能够使被试的反应主要决定于单一联想，例如要求被试聚焦于花和好，那么被试对花和积极效价之间的联想就比其他类别对之间的联想(如花和消极、昆虫和积极、昆虫和消极)更容易获得。BIAT的焦点操作消除了非焦点类的相关性，控制了个体间的差异和其他非联想作用(nonassociativeinfluences)(即和IAT中类别概念无关的联想)，这些非联想作用是通过再编码混淆了IAT效应。
　　BIAT是通过焦点类别消除再编码加工过程。具体来说，在BIAT相容试验区组中，两个焦点类别的单一特征有别于非焦点类别和刺激决定了反应选择，从而消除了再编码在相容试验区组和不相容试验区组中的差异。Fdese和Fiedler(2010)认为BIAT仅需要较少的试验次数，这能够阻止策略和意志的影响，因而控制了不必要的刺激和虚假效应对IAT效应的混淆。但是无论是相关研究还是实验研究都表明聚焦策略并没有消除再编码加工过程等非联想作用对IAT效用的混淆，特别是当焦点类别从“积极”变为“消极”(花一昆虫，积极，消极BIAT)，从“自我”变为“他人”，BIAT的信度和聚合效度降低较多，这说明BIAT成绩可能是多种变异的复杂混合，不仅仅是IAT效应，因此聚焦策略不仅没有消除再编码加工过程等非联想作用对IAT效应的混淆，可能又引入了新的变异混淆了IAT效应。Rothermund和Wentura(2010)也认为从理论分析来看，BIAT并没有改变传统IAT双区组这一造成再编码效应和其他非联想作用的基本结构特点，因此不可能消除再编码加工过程，并且认为消除了双区组结构的IAT－RF、SB－IAT和分类成对特征任务(the Sorting PairedFeatures Task，简称SPF)更有希望消除再编码加工、任务转换消耗和基于刺激特征的效应，但没有提出进一步的实验证据。
　　
　　4、未来展望
　　
　　根据规范性分析，虽然我们还没有完全弄清楚IAT测的是什么、IAT效应的产生机制以及IAT效应是否自动化。但是，这并不意味着IAT不具有实用价值。从现有的研究证据来看，IAT基本上满足了内隐测验的三个标准，只是离完美的内隐测验还有一定的距离。规范性分析的目的就是找出测验的不足之处，提出未来的研究方向，为提高测验质量提供思路。研究表明，IAT至少在某些条件下和一些外显变量相关，而这些外显变量和传统的外显测验没有关系，因此IAT作为个体差异的测量工具有充足的可靠性。但是，IAT效应受多种因素影响，并不是对特定心理属性内隐测量的一个纯指标，如果把IAT作为单一个体水平的测量工具，就需要慎重解释研究结果。未来的研究应该着重揭示能够引起IAT效应变异的各种变量以及这些变量如何引起IAT效应(De Houwer etal.，2009)。
　　就What标准而言，更多的研究不仅应该关注能导致IAT效应的心理属性，而且更应该关注与这些心理属性有关的变量；就How标准而言，未来的研究应该关注影响IAT效应的各种加工过程的相对贡献，不仅要关注被测量的心理属性是否以及在什么条件下能导致IAT效应的变异，还要关注能导致IAT效应的变异其他心理属性；就内隐标准而言，很少有研究关注IAT效应是否满足内隐标准。IAT研究都假设被试没有意识到影响IAT效应的心理属性，但这种假设没有在相关的研究中得到检验。另外，大部分关于内隐测验信效度的研究是相关研究而不是实验研究，这些研究的主要目的是评价IAT成绩是否真正的反映了内隐动机，而很少有研究关注不同的加工过程如何对内隐动机产生影响，而这才是评价一个内隐测验信效度最根本的部分。最后，未来的研究还应该关注能否用IAT研究多个目标客体和单个属性效价之间、同一目标客体和多个属性效价之间、多个目标客体和多个属性效价之间的联想强度。

内隐联想测验【内隐联想测验新变式述评:基于规范性分析框架】

热点文章阅读