评价中心的结构效度研究:结构效度评价量表

发布时间:2020-03-03 来源: 日记大全 点击:

  摘要 评价中心虽然具备很高的预测效度,但其结构效度指标却不太理想,如研究普遍发现其汇聚效度和区分效度较低。影响评价中心结构效度的因素众多,如评分维度因素(数量和类型)、评价者因素(培训方式和人员类型)、测评方法因素(情景导向特征、特质激活潜力、测评活动形式)以及系统的观察与评价程序。该文从上述因素出发,综述了评价中心结构效度的相关研究,总结了提高评价中心结构效度的措施,并指出了未来的研究方向。
  关键词 评价中心,结构效度,汇聚效度,区分效度。
  分类号 B849:C93
  
  评价中心技术(assessment center)是一种兴起于西方的综合性人事测评方法,自1952年美国电话电报公司(AT&T)首次使用该技术以来,评价中心便在各国的企业组织中迅速传播,被广泛应用于管理人员尤其是中高层管理者的评价、选拔、培训及发展领域。
  作为一种人事测评方法,评价中心的效度是研究者和实际工作者都极为关注的一个问题。然而,在过去的20多年中,研究者遇到了一个明显的困境:评价中心虽然具备较好的效标关联效度,预测准确性很高[1],但其结构效度(construct validity)指标却不太理想[2,3]。因此,对于评价中心有效性的原因之争论一直不断,且至今尚无明确的结论。对评价中心结构效度问题进行深入探讨,既在理论上能有效澄清悬疑,又能为实际工作者提供具体指导和建议,有效降低评价中心在设计、实施及控制上的误差和变异,提高测评质量,更好地为人力资源管理工作服务。
  
  1 评价中心结构效度的概念、指标和研究方法
  
  在测量学上,效度指的是一个测验对其所要测量的理论结构或特质测量到什么程度的估计,对效度的检验包含了对测量工具的理论构想进行验证和利用实证证据验证测量工具的效度两个过程,也就是对结构效度和效标关联效度或实证效度的评价过程。
  结构效度指的是测验能说明理论所构想的结构或特质的程度,或者用某种结构或特质来解释测验分数的恰当程度,其着重点是测验本身、测验赖以编制起来的心理结构理论和测验测量到某理论结构或特质的能力;而效标关联效度可用来了解测验分数能否有效地预测或估计某种行为表现,是关于测验结果的一些实际用途的检验,它着重于测验分数是否与效标测量有高度的相关,也就是说,它注重的不是预测变量,而是效标的测量。对效标关联效度的研究并不能脱离作为测验编制基础的心理结构理论,而恰当效标的确定也是心理结构理论的问题[4]。
  任何一个测验都需要各式各样的效度证据,但效度又是由一定的测验目的规定的,不同的测验偏重于不同种类的测验效度。作为一种人事测评方法,评价中心追求实证效度和预测效度,其意义是显而易见的,但结构效度也不可忽视,且与前者关系密切。评价中心若仅有实证效度,而结构效度很差,那么其测量的有效性也值得怀疑[5]。
  结构效度没有单一的效度指标,要采取多种方法,从多方面搜集资料,才能逐步验证测验的结构效度。对评价中心结构效度的研究一般表现为三个层面:(1)汇聚效度(convergent validity),指的是同一评价维度的评分在不同的测评方法之间的相关性,例如无领导小组讨论、公文筐、演讲等不同的测评方法都包含了对“工作组织性”这一维度的评价,该相关系数越高,说明汇聚效度越好;(2)区分效度(discriminant validity),指的是同一测评方法内不同测评维度之间的评分的区分性,也用相关系数表示,例如无领导小组讨论一般包含对敏感性、工作组织性、问题解决能力、领导能力等不同维度的评价,该相关越低,说明区分效度越好;(3)总体评价(overall assessment ratings, OARs),它反映的是对被评价人员的绩效的全面性评价,因此除了包含前两个层面的水平外,总体评价还反映了其它来源的信息,例如同伴评价、人格测量、能力测验分等。但总的看来,目前对评价中心结构效度的研究多集中于前两个层面,即:汇聚效度和区分效度,通过这两种指标能大体上反映评价中心结构效度的优劣。
  对评价中心结构效度的研究一般采用多质多法(multitrait-multimethod, MTMM)和验证性因素分析方法(confirmatory factor analysis, CFA),研究的结果较为一致:同一测评维度在不同测评方法之间的评分相关程度较低(低汇聚效度);而同一测评方法中不同测评维度的评分的相关程度则较高(低区分效度)[6]。例如,Sackett和Tuzinski(2001)[3]研究发现,在典型的评价中心中,同一维度在不同测评方法间评分的平均相关为0.25,而相同测评方法中不同维度评分的平均相关却为0.58。因此有研究者指出,结构效度问题是评价中心研究领域中最大的悬而未决的问题[5]。
  影响评价中心结构效度的因素众多,相关的研究也存在不同的视角和侧面,但从评价中心的基本成分来看,大致表现为评分维度、评价者因素、测评方法、系统的观察与评价程序这几个方面。
  
  2 评分维度与评价人员因素
  
  2.1 评分维度
  从人事测评的角度而言,人们一般希望能从不同的方面对被评价人员进行较为全面的评价,但人的信息加工能力是有限的,评分维度如果过多,就会加重评价人员的信息加工负担,容易造成评分误差,影响评分效果,因此评价中心应该限制评分维度的数目,维度不宜过多。Gaugler和Thornton (1989)研究[7]发现,评价人员能在3个评分维度上取得较好的汇聚效度和较高的评分准确度,而当维度增加到6个或9个时,评分效果就明显下降,但维度的数目对区分效度的影响不大。此外,对维度的概念界定也会对评价中心的结构效度产生影响,比如当不同的评分维度间的概念区分性较强时,会取得较高的区分效度,而当维度间的概念区分性较弱时,则区分效度较差[6]。
  另外的问题是:选择什么类型的维度是合适的?在实践中,各组织普遍采用的维度较为相似,例如敏感性、主动性、人际关系、问题解决、沟通能力、领导能力、计划与组织等,这套维度结构沿用较久、应用较广。Joyce等(1994)曾将这种传统的评分维度与基于管理工作(如内部沟通、绩效管理等)的职能结构上的一套评分维度做了对比,发现基于工作取向的维度也同样表现出较低的汇聚和区分效度[8]。虽然根据不同的测评目标来开发与目标岗位相关更高、联系更紧的维度,在一定程度上能提高测评的预测效度,但到底选择什么样的维度能同时取得较好的结构效度和预测效度呢?未来有必要做更多的研究。
  除此之外,Klimoski(1993)也提醒说,除了评价中心事先确定的评分维度外,评价人员从自身对目标岗位、管理工作及其效果的认知中也可能产生一种不同的维度结构,这套维度内隐于评价人员的认知中,可能间接对评价产生影响[9]。但是否有影响,有何影响,目前还没有研究来证实。
  
  2.2 评价人员培训
  关于评价人员培训,研究者更多关注的是培训的方式与内容。总的来看,对评价人员培训一般有以下几种方式:(1)以避免评分者效应(rating effects)的培训,例如光环效应(halo error)、宽容效应(leniency error);(2)行为观察法培训(behavior observation training),这种培训方法将重点集中于如何提高行为观察的可靠性和有效性上,强调避免观察误差,提高观察的准确度;(3)绩效维度培训(performance dimension training),强调对评分维度的明确界定和操作化;(4)参照系培训(frame-of-reference training),除了强调评价人员应该对维度有更好的理解之外,参照系培训法还向评价人员提供对被评价人员绩效判断的相同的参照标准,按照这种统一的评分标准来培训评价人员,帮助评价人员在头脑中建立更一致的认知图式和评分参照系。研究表明,绩效维度培训能带来更好的区分效度[15],而相对于其它培训方法,参照系培训能带来最高的评价准确度[16]。在实践中,绝大多数的评价中心的对评价人员的培训过程是对以上四种方式的综合运用,从而提高行为观察的效果。
  
  2.3 评价人员类型
  由于程序运作的复杂性和很高的技术要求,评价中心成为一种比较依赖测评专家的人事测评方法,因此,由什么样的人员来担任测评人员便是一个重要的问题。研究者很早就开始注意到评价人员类型对评价中心的结构效度的影响,例如,研究发现,作为评价人员的心理学家要比管理者或工作专家在评分上取得更好的区分效度[10,11]。不过,这两种类型的评价人员各有优劣之处,这主要体现在心理学家更擅长于评价个体较稳定的特质和潜力,而管理者和工作专家则更精于对实际工作能力的判断[12,13]。总的来看,相对于评价人员的出身背景而言,评价人员的评价经验则显得更为重要,尝试由不同出身背景的评价人员互相组合搭配,也许能提高评价中心的结构效度,但这也需要进一步的证实。
  
  3 测评方法
  
  3.1 测评情景导向特征
  80年代以来,当人们发现评价中心在结构效度上存在缺陷时,便开始在评价中心的程序和设计上作了许多改进。这些努力虽能部分地提高维度评价上的汇聚和区分效度,但在同一测评活动中,对不同维度的评分间的相关仍然要明显高于不同测评活动中对相同维度的评分间的相关,也就是说,测评活动的影响效果仍然要明显大于测评维度的影响效果。
  对这一现象如何解释呢?Lance等认为,在过去的研究中普遍发现的测评活动的显著影响,恰好反映了被评价人员的绩效表现是以测评情景为导向的(situational specificity),而非方法变异(method bias)[17]。也就是说,评价中心结构效度的缺陷不应归因于程序和设计上的局限,影响评价中心测评结果的因素是测评情景或方法,在不同的测评活动中被评价人员的绩效表现是不一致的。而Lance等在后来的进一步研究中支持了情景导向的假设[18]。
  国内研究者吴志明等(2001)采用多质多法和验证性因素分析,同样证明评价中心的评分中测评情景导向性[19]。为什么影响评价中心评分的主要因素是测评情景而不是测评维度呢?吴志明等从四方面讨论了其原因:(1)光环效应,由于评价中心中可观测行为的缺乏和评价人员信息加工能力的局限,导致被评价者在某一维度上的表现出色或表现欠佳而在其它维度上同样得高分或得低分;(2)测评情景效应,由于不同的测评情景中表现测评维度所代表的行为的机会不同,还由于练习效应、动机变化等变量的影响,因此在不同的测评方法中,被评价者的绩效表现是不稳定的;(3)评定的过程,评价中心的评价过程有着十分强的组织结构性,被评价人员的行为往往被清晰的划分为一些独立的行为样本,评价人员被迫基于测评情景对这些行为进行分类,因而会损害汇聚效度系数;(4)测评维度的设计,一方面同一测评维度在不同测评情景中虽然表面上名称相同但内涵却不同,另一方面同一测评情景中的不同测评维度难以区分,独立性较低,相关较高,导致区分效度和汇聚效度较低。
  评价中心测评情景导向的特征表明,评价人员在评分时是按照被评价人员在测评情景中的表现进行评分的,而不是按照个人的稳定特征进行的,评价中心是以测评方法来保证其有效性的,不同的测评方法对评价中心的测评结果影响很大。同样也可以说,评价中心的结构效度不是研究者最初所设想或期待的那样,即评价中心不是被用来评价被评价人员的绩效维度,而是为被评价人员提供展现其绩效能力机会的活动[2]。故Lovler等(2002)也指出,未来用于提高评价中心结构效度的努力,如扩大维度(代表“特质”)的影响效果和减小活动(代表“方法”)的效果,很有可能如同过去的20多年一样是徒劳无功的[18]。
  
  3.2 测评活动中的特质激活潜力
  如上所述,在不同的测评情景中,被评价者表现测评维度所代表的行为的机会是不同的。Haaland和Christiansen(2002)运用特质激活理论(trait- activation theory)对评价中心的汇聚效度作了深入探讨[20]。特质激活潜力(trait-activation potential)指的是在一个特定的情景中能观察到个体与特质相关的行为表现的差异的能力[21]。在一个情景中能观察到与特质相关的行为差异的可能性越大,该情景的特质激活潜力就越高。而在情景中能否有机会观察到与给定的特质相关行为主要取决于情景的强度以及情景与特质的相关度。
  按照强度可将情景分为强情景和弱情景。所谓强情景(strong situations)指的是在该情景下,对个体行为的要求较为明确、具体和统一,个体对情景的反应很少存在差异。而在弱情景(weak situations)下与之相反,对个体行为表现的要求并不十分明确,个体对情景的认知、反应及行为结果上倾向于存在差异。强情景容易将个体的一些重要特质模糊化,因而在行为观察上差异较小。而在弱情景下行为观察存在较大的变异,这样,个体对情景的反应更能由个体差异变量和稳定特质来预测。只有通过相对弱的情景,跨情景中的行为观察才能有高相关,而强情景则会导致相关被削弱,也没有什么实际意义。影响特质激活潜力的另外一个因素是情景与感兴趣的特质的相关度,相关程度越高,则特质激活潜力越大,反之就越小。
  Haaland和Christiansen运用跨度为6年(1993~1999)的数据,采用了5项测评活动(无领导小组讨论、计划工作角色扮演、员工辅导的角色扮演、公文筐以及会议的口头陈述)和5种测评维度(敏感性、下属辅导技能、问题解决能力、工作组织技能以及压力忍受性),并用纸笔人格测验作为对特质激活潜力判断的操作处理。结果表明:当评价中心的测评活动具备较高的特质激活潜力时,相关维度上评价之间的汇聚效度会更好。并且,当活动出现如下情景特征时,能获得较好的汇聚效度:①、情景活动不能太过强以至于隐藏个体的差异;②、拥有与特质行为相关的暗示;③、测评活动应具备能激活与成功绩效相关的特质的能力。
  
  3.3 测评的活动形式
  在实践中,有些测评活动能唤起与众多维度相关的行为,而有些活动则显得更为“纯净”,只与少数维度相关。因此,如何选择和设计测评活动便是一个问题。除此之外,一些经受过培训的角色扮演者经常被用于唤起被评价人员与维度相关的行为,以降低一些意外的活动变异。比如有研究发现,当角色扮演者能积极地扮演其角色时,会提高汇聚效度和区分效度;而较消极被动时,就无法唤起与维度相关的行为,则结构效度也会降低[6]。
  最后,在测评活动的指导过程中,Kleinmann等(1996)发现,如果有意识地向被评价人员提示在活动中会测评哪些维度,哪些行为与何种维度相关,被评价者将更可能引导自身向维度靠拢,其行为表现更为清晰和一致,评价人员也能更好地区分维度与行为间的差异,评分也会表现出较好的汇聚效度和区分效度[22]。
  
  4 系统的观察与评价程序
  
  4.1 评价人员的认知负荷
  众所周知,对被评价人员的行为表现进行观察和评价是一项有很高要求的认知性任务。从信息加工过程来看,这一任务的过程表现为以下阶段:首先,在每一项测评活动中,评价人员观察被评价人员的行为,尤其要将注意力投入到与维度相关的那些行为上;然后,评价人员将这些行为信息进行解码,这一过程较为复杂,评价人员必须投入较多的思维活动;接着,这些行为信息被储存到记忆中以待后来的使用,这通常发生在测评活动结束的时刻;当作出评价的时候,评价人员必须重新提取记忆中的信息,并加以综合。
  人们注意到,评价人员的信息加工负荷是相当大的,因此他们只能选择性的参加一定比例的测评行为活动,其结果是有可能产生评分误差。例如,在评价人员的观察和评价过程中,通常有一个双重任务:观察和记录。但相对于评价人员已有的认知加工能力而言,当评价人员的注意力由活动转移到记录本上时,一些重要的行为信息便有被忽略的可能,或者不适当地将行为进行归类[23]。而且在实践中,评价人员有时不仅仅是被动的观察者,同时也是一些测评活动的主动参与者,在活动中扮演着一定的角色,这种角色扮演也会限制对行为的同时记录[24]。这样就可能带来较低的评价人员信度、评分准确度和结构效度。
  Kolk等(2002)曾考察了两种观察与记录方式的效果[13]:一是在活动进行中同时进行观察和记录;二是评价人员在观察过程中不做记录,但将记录行为延迟到每一种测评活动结束的时刻立即进行。研究比较了这两种方法的三种效果变量:评价人员信度、光环效应及准确度。但结果仅发现,有经验的评价人员要比无经验的评价人员产生更显著的高评分准确度,这一点与以前的研究一致,但却没有找到明显的证据支持哪一种方法在三种效果变量上有更好的效果。显然,如何降低认知负荷,目前仍是一个难题,未来应更直接地考察评价人员认知负荷的来源。
  
  4.2 观察和评价方法
  在评价中心中,一般存在3种观察和评价方法:
  第一种是传统的观察与评价方法。传统方法由AT&T首创,它包含4个相互独立的阶段:在测评活动中评价人员观察被评价人员的行为并同时做记录;然后,评价人员将所记录的信息归类到不同的行为维度中;接着,评价人员对每一个维度作出一个定量的评价;最后,不同的评价人员一起对评价作出重新评估。
  第二种方法是行为列表法(the behavioural checklist method)。和传统方法一样,评价人员首先需要记录正在发生的行为,但随后评价人员会使用一种行为列表,在列表中将每一种行为发生的频数加以总结。这一附加的步骤是为了减低行为分类时的认知负荷。行为列表法虽然有利于评价人员对观察行为进行解码及回忆,但其对结构效度的影响如何,研究的结论却不太一致。
  第三种方法是行为编码方法(the behavioural coding approach)。这种方法事先对每一种评价维度有十分明确的、统一的界定,并在观察表格上列举出典型的积极和消极的行为例证,要求评价人员重点关注这些维度和行为,而反对评价人员个人主义式的解释。行为编码法的好处是:首先,标准化程度较高;其次,因为不必对行为的描述进行详细记录,评价人员经受的知觉干扰可能更少;另外,评价人员的注意力能有效集中于维度上,将观察行为与明晰的认知分类进行有效联结,有助于评价人员的长期记忆、回忆和解释。但行为编码法的潜在缺点是,评价人员的注意力完全集中于事先提供的维度结构上,有可能导致无法观察到或忽略维度以外的其它行为特征,这种影响的大小则依赖于所提供的维度典型行为的范围与合适性程度,以及对评价人员的说明和指导。
  哪一种观察与评价方法更有效呢?Hennessy等(1998)[23]选取30个英国组织的评价人员,运用实验方法,考察了上述三种方法的效果,结果发现:三种方法在评价准确度上的效果差别不大;相对于传统方法,行为列表法和行为编码法能显著地降低评价人员之间的偏差,但研究并没有发现这两种方法能提高区分效度的明显证据;在对待各种方法的态度上,传统的方法在大多数的组织中仍得到采用,行为编码法受到了广泛的支持和接受,而使用者不太愿意建议采用行为列表法。
  另外,在实践中很多评价中心多采用活动内评价方法(within-exercise rating method),即在每一种测评活动结束后完成对所有维度的一次评价,但这样会产生共同方法效应(common method effects)。也有些评价中心采用维度内评价方法(within- dimension rating method),即在所有的测评活动结束后再进行维度的评价,但这样也能产生共同评价者效应(common rater effects)。有研究者指出,相对于活动内设计方法,维度内设计方法能产生较高的汇聚效度和区分效度 [25,3]。Kolk等(2001)设计出每一名评价人员只在一种测评活动中对一种维度作出评价的评分策略[18],这种策略要求具备“维度数×测评活动数”的乘积的数量的评价人员,但维度评价在跨维度和跨活动中是独立的,也就能消除所有的共同方法效应和共同评价者效应。不过,这种方法的缺陷是成本太高,一般的组织很难实施。
  
  5 提高评价中心结构效度的措施与研究总结
  
  Lievens(1998)对1976至1997年间的21项关于评价中心结构效度的研究进行了元分析[6],对如何提高评价中心结构效度的措施进行了总结(见表1),值得实践者参考和借鉴。
  表1中,对于评价中心的观察与评价程序的设计,Andres和Kleinmann(1993)所推荐的原则是:①每一名评价人员只对每一名被评价人员进行一次观察;②被评价人员在活动中碰面的机会最低为2次,最高4次;③每一对评价人员至少碰面2次,最高4次。研究者认为这套原则能有效降低评价过程中的信息负载、对照效应、光环效应、移情效应的负面影响,提高评分效度[6]。
  综上所述,影响评价中心结构效度的因素众多,相关研究的结论也不太一致,未来也有必要做进一步地研究,但总的看来,可以归结为以下几点:
  首先,在评分维度的数目上,目前的研究结论基本一致,维度的数目不宜过多,但在维度的选择和界定上应慎重,一个可行的原则是与实际工作相关联。
  第二,对于心理学家应该在评价者团队中扮演什么角色,还存在分歧,但更多的人认识到心理学家和管理者作为评价人员各有优劣,笔者认为,评价者的评价经验相对于其出身而言更为重要,二者若能取长补短则更为理想,另外,对评价者培训应重点考虑参照系培训方式,致力于提高行为观察的效果。
  第三,影响评价中心结构效度的因素虽然很多,在程序和设计上的努力虽能部分提高其结构效度,但评价中心以测评情景为导向的特征表明,评价中心是以测评方法来保证其有效性的,相对于维度而言,测评方法对测评结果的影响更大,因此实践者应该十分注重对测评方法及活动的选择与设计,避免方法效应,应采取各种措施积极地唤起被评价者的与特质和维度相关的行为。
  
  第四,应设法降低测评中评价人员的认知负荷,如采用行为列表或行为编码方法,提高观察与评价的准确度,为了提高结构效度,实践者也应该更多地采用维度内评价方法。
  最后,如众多的研究者所指出的那样,在以往的研究中,对于评价中心的结构效度和效标关联效度的研究往往是分开进行的,未来的研究需要将这两者结合起来,同时探讨它们之间的关系[26]。例如,具有良好结构效度的评价中心是否同样具有较好的效标关联效度?同时,具有良好的效标关联效度的评价中心其结构效度又如何?这一问题恰好涉及评价中心的本质与核心,应成为未来研究的重点方向。
  
  参考文献
  [1] Gaugler B B, Rosenthal D B, Thornton G C, Bentson C. Meta-analysis of Assessment Center Validity. Journal of Applied Psychology, 1987, 72: 493~511
  [2] Lievens F, Klimoski R J. Understanding the assessment center process: Where are we now? International Review of Industrial and Organizational Psychology, 2001, 16: 246~286
  [3] Sackett P R, Tuzinski K. The role of dimensions and exercises in assessment center judgments. In M. London (Ed.). How people evaluate others in organizations. Mahwah, NJ: LEA, 2001. 111~129
  [4] 金瑜. 心理测量. 上海:华东师范大学出版社, 2001. 209~230
  [5] Collins J M, Schmidt F L, Sanchez-Ku M, Thomas L, McDaniel M A, Le H. Can basic individual differences shed light on the construct meaning of assessment center evaluations? International Journal of selection and assessment, 2003, 11(1): 17~29
  [6] Lievens F. Factors which improve the construct validity of assessment centers: A review. International Journal of Selection and Assessment, 1998, 6(3): 141~152
  [7] Gaugler B B, Thornton G. C. Number of assessment center dimensions as a determinant of assessor accuracy. Journal of Applied Psychology, 1989, 74: 611~618
  [8] Joyce L W, Thayer P W, Pond S B. Managerial functions: An alternative to traditional assessment center dimensions? Personnel Psychology, 1994, 47: 109~121
  [9] Klimoski R J. Predictor constructs and their measurement. In: Schmitt N, Borman W C. (eds.) Personnel Selection in Organizations. San Francisco, Jossey-Bass, 1993. 99~135
  [10] Gaugler B B, Rosenthal D B, Thornton G. C, Bentson C. Meta-analysis of assessment center validity. Journal of Applied Psychology, 1987, 72: 493~511
  [11] Sagie A, Magnezy R. Assessor type, number of distinguishable categories, and assessment center construct validity. Journal of Occupational and Organizational Psychology, 1997, 70: 103~108
  [12] Tziner A, Ronen S,Hacohen, D. A four-year validation study of an assessment center in a financial corporation. Journal of Organizational Behaviour, 1993, 14: 225~237
  [13] Kolk N J, Born M P, van der Flier H,Olman J M. Assessment center procedures: Cognitive load during the observation phase. International Journal of Selection and Assessment, 2002, 10(4): 271~278
  [14] Lievens F. Assessor training strategies and their effects on accuracy, inter-rater reliability and discriminant validity. Journal of Applied Psychology, 2001, 86: 255~264
  [15] Woehr D J. Performance dimension accessibility: Implications for rating accuracy. Journal of Organizational Behavior, 1992, 13: 357~367
  [16] Woehr D J,Huffcutt A I. Rater training for performance appraisal: A quantitative review. Journal of Occupational and Organisational Psychology, 1994, 67: 189~205
  [17] Lance C E, Newbolt W H, Gatewood R D, Foster M R, French N R,Smith D E. Assessment center exercise factors represent cross-situational specificity, not method bias. Human Performance, 2000, 13: 323~353
  [18] Lance C E, Foster M R, Gentry W A,Thoresen J D. Assessor cognitive processes in an operational assessment center. Journal of Applied Psychology, 2004, 89(1): 22~35
  [19] 吴志明, 张厚粲. 评价中心的构想效度和结构模型. 心理学报, 2001, 33(4): 372~378
  [20] Haaland S, Christiansen N D. Implications of trait-activation theory for evaluating the construct validity of assessment center ratings. Personnel Psychology, 2002, 55(1): 137~163
  [21] Tett R P, Guterman H A. Situation trait relevance, trait expression, and cross-situational consistency: Testing a principle of trait-activation. Journal of Research in Personality, 2000, 34: 397~423
  [22] Kleinmann M, Kuptsch C,Koller O. Transparences: A necessary requirement for the construct validity of assessment centers. Applied Psychology: An international Review, 1996, 45: 67~84
  [23] Hennessey J, Mabey B, Warr P. Assessment centre observation procedures: An experimental comparison of traditional, checklist and coding methods. International Journal of Selection and Assessment, 1998, 6(4): 222~231
  [24] Zedeck S. A process analysis of the assessment center method. Research in Organizational Behaviour, 1986, 8: 259~296
  [25] Sackett P R, Dreher G F. Constructs and assessment center dimensions: Some troubling empirical findings. Journal of Applied Psychology, 1982, 80: 664~670
  [26] 王小华, 车宏生. 评价中心的评分维度和评分效果. 心理科学进展, 2004, 12(4): 601~607

相关热词搜索:评价 结构 研究 评价中心的结构效度研究 中国科学评价研究中心 南大社科研究评价中心

版权所有 蒲公英文摘 www.zhaoqt.net