【均匀设计在心理实验中的应用探讨】均匀设计实验

发布时间:2020-03-03 来源: 散文精选点击：

　　摘要　均匀设计是一种由中国数学家王元、方开泰在1979年提出的一种新实验设计方法，保留并提高了正交设计的均匀分散性。实验次数等于处理水平数。均匀设计包括选择均匀设计表和安排实验等步骤。适合于探索性实验，特别适合于侦测多个因素(2―18个)的交互作用。不但能处理连续变量，还能处理离散变量。可以在心理实验中应用。
　　关键词　全面实验设计；正交设计；均匀设计；大鱼小池塘问题
　　分类号　B841
　　
　　1　引言：从大鱼小池塘问题到均匀设计
　　
　　心理实验设计从简单到复杂，从单因素到多因素，从两水平到多水平，“反映了心理实验的进步历程”和“心理科学的发展”(朱滢，2006)。多因素多水平实验设计的主要优点是能够揭示变量之间的交互作用(Interaction)，提高研究的外部效度(External validity)。但实验处理组合(Treatment combinations)会因实验因素及其水平的增加而急剧增加(方开泰，1994：孙祥，陈毅文，2005)。比如，4×4×4×4的实验，有处理组合256个，而5×5×5×5的实验就多达625个。心理学传统实验方法难以容纳如此多的实验处理组合。如果把实验处理比作“鱼”，把实验设计比作“池塘”的话，很容易发现“鱼”太大，“池塘”太小。实验设计中的这种现象可名之日大鱼小池塘问题(Big-fish-little-pondproblem，BFLPP)。
　　伴随着BFLPP，实验设计经历了全面实验设计(Full experimental design)、正交实验设计(Orthogonal experimental design)和均匀设计(Uniform design)等阶段。
　　全面实验设计中处理组合数最多，涵盖了所有可能的组合。全面实验设计既难以实现，花费又高。为了提高效率，降低成本，研究者发现可从所有组合中挑选部分有代表性的处理组合进行实验。正交设计就是一种便捷有效的挑选实验处理的方法。与全面实验设计相比，正交设计所需处理组合大大减少。表1即是一个5×5×5×5的正交设计示例，有25个实验处理(即实验点)。这25个实验点在三维空间的排列具有“均匀分散”和“整齐可比”两个特点。与全面实验需要625个实验处理相比，无疑是大大地减少了。然而，25个对心理实验来说仍嫌偏多。因为表1尚未考虑因素间的交互作用。若考虑交互作用，还需增加变量数，即表1还需增加列数(赵选民，2006)。
　　其实，正交设计仍是全面实验(只不过是局部全面实验)，因为其中任两列恰好组成一次全面实验(见表1)。研究发现，“整齐可比”正是实验处理组合居高不下的根由。方开泰提出放弃“整齐可比”特点，进一步提高实验点的“均匀分散”特点，并据此发展出一种新的实验设计――均匀设计(方开泰，1980)。表2就是前述5×5×5×5那个实验的均匀设计，有5个代表性实验处理组合。
　　
　　目前，正交设计已被引入心理研究(孙祥，陈毅文，2005~黄常新，李卫萍，2000；柳学智，1993：黄常新，张其吉；李燕，曹子芳，1997)，取得了一定的实效。在这些采用正交设计的研究中，实验处理组合至少都有7个，有的甚至几十个。要是用全面设计，根本无法实施。而孙祥、陈毅文(2005)向我们表明正交设计在消费行为研究中的强大功效，一次能够处理上百个变量。虽然迄今尚未见到以“均匀设计”为题讨论均匀设计的心理学文献，但实际上心理学很早就开始使用和研究均匀设计了。蒋声、陈瑞琛(1987)证明实验心理学里一种相当成熟的至今仍然在使用的实验设计――拉丁方设计(Latin squares design)即是均匀设计的一个特例(在实验处理数索性实验。实验初期，可用均匀设计进行探索性实验，以决定哪些关键因素进入实验，因素水平取多大范围。从大规模实验处理中探明关键因素，同时，由于是整体估计，可以避免多次单因素实验带来的误差。(2)多快好省地侦测多个因素之间的交互作用。交互作用是多因素多水平实验关注的焦点。全面实验需要考察完所有的情况后才能探明交互作用。正交设计由于其“整齐可比”的特性，搞的仍是“人海战术”。均匀设计则无需如此。(3)求取变量间的最佳组合关系。例如，消费行为研究往往涉及上百个品牌属性(孙祥，陈毅文，2005)，人格维度与注意分配的组合多则上千，少则几十(黄常新，张其吉，2008)。这类情况若运用均匀设计，可使工作量大大减少，而又不失(按研究需要进行设定)准确性。(4)还有一种特殊情况，即需要考察实验顺序、被试差异等对实验结果的影响的情形。在传统心理实验中，这种情况多用拉丁方设计加以处理(孟庆茂，常建华，1999)。当实验处理数很大时，拉丁方设计就难以胜任了。这时可以采用拉丁型均匀设计，以扩展其对实验处理的容量。
　　
　　2.2均匀设计的操作步骤
　　下面以一个5×5×5×5实验为例。该实验改编自舒华的《心理与教育研究中的多因素实验设计》一书(舒华，2004)，即生字密度等对阅读理解(Y)的影响。原为一个3×3×3的实验。作者展示了完全随机设计、重复测量设计等多种设计方法。其中最省的是三因素被试内设计，只用了4个被试。现将该实验改变为5×5×5×5，研究问题是生字密度、句子长度、文章主题的熟悉度和词章的优美度四个因素之间的交互作用如何?若用完全随机设计，需要被试5×625=3125人，这是不现实的。而采用4因素被试内设计，则每个人需阅读625篇文章，也是难以实现的。可行的选择是采用正交设计(见表1)，但也需要25×5=125人，或者让5个人每人读25篇文章，实施起来难度也不小。而用均匀设计则仅需10个人每人读5篇文章，简单易行。因此我们选用均匀设计，步骤如下：
　　2.2.1根据实验的目的，选择合适的因子和相应的水平。
　　示例4个因素及其水平如下：
　　(1)生字密度(A)：生字与文章总字数的比值，有5个水平：
　　1：25、1：20、1：15、1：10、1：5(依次记为：A1-A5)
　　(2)句子长度(B)：文章句子的平均字数，有5个水平：
　　5、15、20、25、30(依次记为：B1-B5)
　　(3)文章主题的熟悉度(C)：文章主题与被试生活的关联程度，有5个等级：
　　5、4、3、2、1(依次记为：CI-C5)
　　(4)词章的优美度(D)：专家评定的文章的优美程度，有5个等级：
　　5、4、3、2、1(依次记为：D1-D5)
　　2.2.2选择合适的均匀设计表，并根据均匀设计表安排实验。
　　设计时，应根据因素数目及水平数选择相应的均匀设计表。由于每因子的水平数为5，可选用5水平的均匀设计表。Us(54)。根据Us(54)，结合其使用表，实验安排如表2(韩汉鹏，2006)。但表2有一个问题，即最多能考察4个变量和一个交互作用。因此，应选用实验处理数稍大的均匀设计表，给误差留下足够的自由度。按此原则，我们选择U*10(108)。根据U*10(108)的使用表，选择其中的1、3、4、5列可安排4个因素。由于该表的因素有10个水平，因此需要进行拟水平改制。即将各列中的(1，2)=>1，(3，4)=>2，{5，6)=>3，(7，8)=>4，(9，10)=>5。这样就得到了U10(55)，见表3。
　　
　　2.3均匀设计实验数据分析
　　对均匀设计所得的实验数据，需采用回归分析方法进行分析。通过分析，可以建立线性回归模型、二次回归模型等。表4是模拟的5个被试的实验数据。
　　2.3.1初始模型设定与修正
　　根据前期探索，我们知道a、b、c、d，及a×b、a×c、a×d、e×d×对阅读理解可能有影响。于是，初始模型设定为：Y=m+X1×a+x2b+x3×c+x4×d+x5Xa×b+x6Xa×c+x7×aXd+x8×c×d。其中，a-d-f表实验因素；x1-x8为需要估计的回归系数，省略了误差项。在SPSS中，调用Regression―Nonlinear过程(数据分析也可以用其它软件实现，如SAS、专门的均匀设计软件)，进行二次曲面回归分析(张文彤，董伟，2004)。得回归方程，Y=11.849+44.937×a，-0.187×b+0.591×c-3.980×d-1.789×a×b-29.820×a×c+53.952×a×d+0.898×c×d。回归方程检验F(9,1)=3831.188，p2=0.999。但模型显示，b、c、c×d的效应不大。因此，可去掉它们，于是模型可修正为：Y=m+x1×a+x4×d+x5×a×b+x6×a×c+x7×a×d。
　　
　　2.3.2模型确定与分析
　　再次在SPSS中调用Regression―Nonlinear过程，相应设定后进行二次曲面回归分析。得回归方程：Y=3.372+28.984×a+1.253×d-2.812×a×b+14.954×a×c+11.275×a×d。决定系数R2=1-Residual SS／Corrected SS=0.885。方差分析及回归系数的估计见表5、表6。
　　
　　2.3.3示例结论
　　模拟数据的分析表明，在生字密度(a)、句子长度(b)、主题熟悉度(c)和词章优美度(d)四个因素中，生字密度对阅读理解的影响最大，词章优美度次之；而且生字密度与其它三个因素之间均存在显著交互作用。
　　
　　3　应用均匀设计进行心理实验需注意的问题
　　
　　均匀设计最大的优点是所需实验次数少，但该方法本身的局限以及心理学领域的独特性决定了只能在一定范围内使用它(见2.1.3)。在实际应用中还需注意以下一些问题。
　　首先，实验时并不是处理数越少越好。因为处理数太少，会损失其精确性。因此需要在效率和精确性之间进行权衡。对于探索性研究，可以不那么精确；但对正式实验，则不得不考虑精确性。
　　其次，没有重复实验的均匀设计所得结果可能是不稳定的。对此，有两种策略加以完善。一是采用较大的均匀设计表，重复实验处理。示例即是将实验处理重复了1次。方开泰(1994)建议最好让误差的自由度>5。二是分步实验，即先用均匀设计探明所关心的交互作用；再有针对性地进行全面实验。在示例中，如果只有生字密度(a)×句子长度(b)、生字密度(a)×主题熟悉度(c)、生字密度(a)×词章优美度(b)三个交互作用显著，就可以再设计三个5×5的实验，以精确地求取各自的主效应和误差方差。
　　第三，均匀设计除了能处理连续变量外，还能处理离散变量，如性别，民族等(王柱，方开泰，1999)。处理离散变量与处理连续变量相比，其选择均匀设计表，安排实验处理等步骤完全一样；不同之处在于数据分析环节。设若某离散变量有m个水平，它可以用通常因素水平的安排法进行设计，但在分析时，它不是对应m个连续变量，而是对应着m-1个相对独立的特征变量组，即虚拟变量或伪变量(null variable)。除了能处理水平数相同的情况外，还可以处理不同的情况。在水平数不同时，需要进行拟水平改制(方开泰，1994)。前文所援引的例子即进行了拟水平改制(详见2.2节)。
　　第四，关于均匀设计的数据分析的问题。实验设计方法之所以能提高效率，是因为背后有特定的数学模型支持，以达到最优。正交设计在特定的方差分析模型下达到最优，均匀设计则在特定的稳健回归模型下达到最优(方开泰，马长兴，2001)。前已述及，当处理数小于5时，均匀设计实际上就是拉丁方设计。此时可采用重复测量的方差分析进行分析(Repeated-measures analyses of variance，ANOVAs)(张文彤，2002)。由于方差分析是回归模型的一个特例，因此拉丁方实验的数据也可用回归模型加以分析。但当实验处理数大于5时，所得数据需用RS model。需要注意的是，在分析均匀设计的数据时，根据情况采用合适的回归模型是非常重要的。孙尚拱(2000)讨论了有重复实验时的数据分析的理论与方法。韩汉鹏(2006)则给出了没有自由度的回归模型的检验方法。
　　此外，值得注意的是，实验设计只是心理实验诸多环节中的一环。相比而言，Anderson在其实验金字塔中所指出的概念设计等方面可能更需留意(朱滢，2006)。
　　
　　4　小结：今后的问题
　　
　　心理学发展中的问题驱动着心理研究方法学的发展。历史上Spearman为解决发展智力理论提出了因素分析法，Glass为说明心理治疗的效果提出了元分析法都充分地说明了这一点。随着心理学研究问题的复杂日益增加，对研究方法学会提出更高的要求，这将从更高层次上推动心理实验方法学的发展。心理实验设计的进步源于一个普遍存在的矛盾――BFLPP。实验设计的每一次进步都可以看作是解决该矛盾的一次新的尝试。因此不管从心理学研究的现实需要看，还是从实验设计的内在发展逻辑看，系统地介绍和探讨均匀设计都是必要的。
　　均匀设计是一种有深厚统计学基础的试验设计方法。这种由中国人创立的试验设计方法已被广泛应用在机械设计与实验、医药等领域，在世界范围内产生了良好的影响。但目前我们还没有查阅到直接以“均匀设计”为题的心理学文献。有意思的是，蒋声、陈瑞琛(1987)曾用组合数学的方法证明了拉丁方设计(当实验次数

【均匀设计在心理实验中的应用探讨】均匀设计实验

热点文章阅读