总体来看,不同的实验设计彼此间无绝对优劣之分,选择什么研究依赖于研究的问题和条件。但在一定情况下,存在一个最合适的实验设计。
第七讲 准实验设计
一、准实验设计的含义与应用领域
未能完全控制额外变量的实验设计,主要是,并未按随机的方法将被试分配到各实验组。
但任何实验设计都不可能达到绝对严格。即使最完善的实验设计,也可能得到错误结论,例如拒绝了一个不应该拒绝的虚无假设。
在无法采用严格的实验设计的情况下,只能通过控制一部分额外变量寻求结论,此即准实验设计。如现场实验研究。
准实验设计采用的符号系统
X:实验处理;
O:对行为的观测,O1、O2、……代表观测次数
二、准实验设计类型
1.单组后测设计
X |
O |
分析:总体上难以解释的设计
2.单组前测后测设计
O1 |
X |
O2 |
Paired t-test
缺点:缺乏适当的对照组
可能存在霍桑效应或安慰剂效应:例如对新教学方法的期望会自动产生好的结果;
可能存在练习效应
结论:总体上难以解释的设计
3.不等同比较组设计
3.1 不等同比较组后测设计
X |
O |
|
O |
两组非随机分类,故只能看作比较组,非控制组,很难说明因果关系。
分析:将两组之间因变量(观测结果)的差异归于处理作用的可靠性仍很低,仍难以得出明确的结论。仍属于“总体上难以解释的设计”。
一种改进的设计:
X4 |
O |
X3 X2 X1
|
O O O O |
例子:辅导时间与学习成绩的关系,t-test
两者具有因果关系的可能性更大了
3.2 不等同比较组前测后测设计
O1 |
X |
O2 |
O1 |
|
O2 |
可能是最普遍使用的一种准实验设计
可先对每一组的前后观测值进行paired t-test,然后对两组之间的前后观测的差值作独立t-test。
缺点:由于不是随机分配各组,仍无法排除各种额外因素的影响。
4.中断时间序列设计 (interrupted time-series design)
简单中断时间序列设计
O1 |
O2 |
O3 |
O4 |
O5 |
X |
O6 |
O7 |
O8 |
O9 |
O10 |
适用于无法找到控制组的情形;可能存在霍桑效应
复合中断时间序列设计
O1 |
O2 |
O3 |
O4 |
O5 |
X |
O6 |
O7 |
O8 |
O9 |
O10 |
O1 |
O2 |
O3 |
O4 |
O5 |
|
O6 |
O7 |
O8 |
O9 |
O10 |
例子:推行改革,先试点
中断时间序列设计的问题:
观测变量变化缓慢需要很长时间才能发现、或难以观察到;
统计分析复杂;
数据采集不容易。
总体评价:
严格地说,单组后测设计、单组前测后测设计、不等同比较组后测设计没有控制任何变量,是一种自然描述,属于“非实验设计”,不是准实验设计。
第八讲 小样本实验设计
一、大样本研究范式与小样本研究范式
1.大样本研究范式特点
随机化抽样、实验控制、统计程序的大量运用
但不适于临床心理研究、不易追踪测量和深入分析
2.小样本研究范式
组平均数仅是一抽象的数值,不能代表组内任何一个个体的实际状况
早期的研究:巴甫洛夫的条件反射研究、斯金纳的研究、电生理研究
适宜研究的领域:临床研究(个案研究)、行为治疗、药物评估
二、小样本研究的程序
1.建立基线:确定研究对象的反应基线
基线:实验处理前因变量的变化水平,理想的基线是“稳定的”,即无明显变化趋向,随机起伏。
2.施加自变量,观察记录因变量的变化,直到因变量变化再次稳定
3.撤除自变量,继续监测因变量的变化
若因变量变化回复到原来水平,可认为自变量与因变量间存在因果关系。
误差及其控制:被试间个体差异、实验过程的误差
小样本研究通常只有第2种误差来源,控制办法:消除、恒定(同一程序、主试、时间、地点、仪器等)
因变量的选择需考虑:客观性、重复性、敏感性
三、小样本研究类型
1.A—B—A设计
白鼠按压杆杠实验:禁食与行为反应
2.A—B—A—B设计(用于临床治疗、行为矫正等领域)
在A—B—A后再施加自变量,观察能否产生预期的变化
3.A—B—A—C—A设计
施加不同自变量
4.A—B1—A—B2—A设计
同一自变量施以不同水平
以上设计的前提:自变量对因变量的作用是暂时的、可逆的。若撤除自变量后因变量的变化无法恢复到基线水平,则有两种可能:自变量的作用并非暂时;自变量的作用未明确证实,可能有其它额外因素影响。
讨论:A—B设计的缺陷
5.A—B多基线设计(multiple baseline design)
6.A—B多反应设计(multiple response design)
四、小样本设计优缺点
内部效度极高、外部效度低、费时、易出现顺序效应
第九讲 反应时间与心理过程的分离
反应时间
从刺激呈现到反应开始之间的时距。反应潜伏期。包括感觉器官与大脑加工、神经传入与传出、肌肉效应器反应所需的时间,其中大脑加工所耗费的时间最多。
唐德斯(F. C. Donders, 1818-1889) 对反应时间(RT, reaction time)的研究
1868年发表论文“关于心理过程的速度”。“生理时间”
从行为水平观测并分析人的心理过程,唐德斯对简单反应和复杂反应作了区分。
A反应(简单反应),要求被试觉察到一个灯光刺激后立即用右手按键作出反应,所测到的反应时称为简单反应时,记录为RTa;
B反应(选择反应):在复杂反应的实验中,安排红绿两个色光刺激,要求被试看到灯光后立即用右手按键作出反应,而看到绿光后立即用左手按键作出反应,所测到的反应时称为选择反应时,记录为RTb;
C反应(辨别反应):另一种复杂反应,安排红绿两个色光刺激,要求被试看到灯光后立即用右手按键作出反应,而看到绿光则不作出反应,所测到的反应时称为辨别反应时,记录为RTc。
唐德斯认为,一个复杂反应只是在一个简单反应上加一些别的动作,这些动作所需的时间可用反应的全部时间减去简单反应所需的时间求得。
由此可以推出,RTb > RTc > RTa,RTa也称为基线时间 (baseline time),RTc在简单反应时的基础上增加了对刺激的辨别时间,因此RTc-RTa为辨别过程所需要的时间,而RTb 则在简单反应时的基础上增加了对刺激的辨别时间以及对反应作出选择的时间,因此RTb-RTc为选择过程时间。
该方法起初是用来确定某个心理过程所需的时间的,故称为反应时间的相减法(subtractive method),但是反过来看,可以从两种反应时的差数来判定某个心理过程的存在。
这一减法逻辑在理论上有相当的合理性,在实验心理学中一直占有很高地位,后来用正电子发射断层扫描研究人脑功能时所采用的减法实验设计,正是在唐德斯的反应时间的相减法基础上直接发展起来的。
斯腾伯格 (S. Sternberg,1969)的研究:反应时间的加因素法(additive factors method)
主要观点:完成一个作业所需的时间是一系列信息加工阶段分别所需时间的总和,如果发现可以影响完成作业所需的时间的一些因素,那么单独地或成对地应用这些因素进行实验,就可以观察到完成作业时间的变化。如果两个因素的效应是相互制约的,即一个因素的效应可影响另一因素的效应,那么这两个因素只作用于同一个信息加工阶段;如果两个因素的效应是分别独立的,那么这两个因素各自作用于某一特定的加工阶段。这样,通过单变量和多变量的实验,从完成作业时间的变化就可确定这一信息加工过程的各个阶段。
一个例子:短时记忆信息提取实验
先给被试相继呈现一系列随机数字(6个以内),作为识记项目,然后再看一个数字(测试项目),并同时开始计时,要求被试回答该测试数字是否是刚才识记过的,按键作出是或否的反应。这样就可以确定被试能否正确提取以及所需要的时间(即反应时)。可以设想,被试先对测试项目进行编码(假设所需时间为e毫秒),然后将编码好的数字与保持在短时记忆中的识记项目(假设为N)逐一比较(假设每一项目的比较耗时为c毫秒),并确定每一项目与测试项目是否匹配(决策),最后作出相应反应,假设作出决策和反应所需时间为d毫秒,根据加因素法原理,被试的反应时为这四个阶段所需时间的总和,即
RT = e + cN + d
也可以写作
RT = cN + (e + d)
这是一个直线方程,其中c为斜率,e + d 为截距。通过对被试在不同记忆集下所作出反应时间的分析计算表明,c = 38,e + d = 397,即每比较一次需时38毫秒,而对刺激编码、作出决定和反应共需397毫秒。该结果有力证明短时记忆中信息的提取是以系列扫描(逐个检查)方式进行的,而非平行扫描(同时检查)。
任务分离 (task dissociation):通过实施两种任务达到对心理过程的分离。
采用双任务法对心理过程进行分离是基于所谓的双分离(double dissociation) 原则。在关于脑损伤病人的神经心理研究中,至少需要两个病例才能运用双分离原则探讨脑局部损伤对行为的影响。在这一方面,双分离原则的逻辑是,若一被试不能顺利完成A任务,另一被试不能顺利完成B任务,已知任务A只与脑区a有关而与脑区b无关,任务B与脑区a无关而只与脑区b有关,则这两个任务存在不同的脑机制。在神经心理学研究中,运用双分离原则研究脑局部损伤对心理行为的影响取得了很大成功。下面的一个例子表明,运用双分离原则可以将人类工作记忆中的词语信息加工与视觉空间信息加工过程分离。
Basso 等报告过对一则病例的研究结果。患者PV是一名28岁的女性,右利手,5年前中风,脑受损面积很大,扩展到脑左半球语言功能区的前后,她不能重复刚听到的句子。Basso 等进一步测验了其词语工作记忆(verbal working memory)和空间工作记忆(spatial working memory),词语工作记忆测验是让被试读完一系列不同长度的随机数字(或字母)串后按顺序背诵出来,空间工作记忆测验则是让被试看完一组相同物体的排列布局后再将它们按原布局重新排出来。研究表明,PV的词语工作记忆较正常人差,但空间工作记忆能力正常。Hanley 等5 报告的一则病例其表现正好相反。患者ELD是一名55岁的的女性,右利手,其脑右半球中央有一脑动脉瘤,导致6年前外侧沟出现血肿,测验结果表明该患者的空间工作记忆能力明显低于正常人,但其词语工作记忆能力正常。
研究还发现,PV和ELD的工作记忆能力缺陷并非由于其编码词语或空间材料的能力缺陷引起。例如,PV的语音分辨音韵判断以及单词的理解能力均正常,其词语项目的长时记忆能力也正常,表明其工作记忆能力受损具有特定的选择性;ELD能正常辨认物体图片以及判断面部表情,其空间记忆能力受损影响了其长时记忆和新的视觉刺激材料的学习,但这一缺陷显然不是由于知觉编码问题。因此,PV和ELD这两个病例为分离词语工作记忆和空间工作记忆提供了较为明确的证据,且进一步表明,词语工作记忆与左半球有关,而空间工作记忆与右半球有关。
通过对两个病例所作的一系列神经心理测查,上述研究运用双分离原则成功地对词语工作记忆和空间工作记忆进行了分离。人拥有感觉、知觉、记忆、思维、表象等多种多样的认知能力,任何一种认知能力都包含多个心理过程,例如较高级心理活动如记忆、思维通常需要感觉、知觉等心理过程的参与,也就是说,感觉、知觉等心理过程通常是多种认知能力的基本环节。在神经心理研究中,如果观察到局部脑损伤导致某种认知能力下降甚至丧失,这就需要确定该能力下降或丧失是否是由感觉、知觉等更一般性的心理过程缺失引起的,否则会使研究结论缺乏明确的说服力。例如,Wang和Bellugi研究了两组分别患有威廉斯氏综合症(Williams Syndrome)与唐氏综合症(Down Syndrome)病人。这两组病人皆由于异常遗传导致神经发育不正常,从而使智力发育迟缓,其中威廉斯氏综合症病人的语言功能保持相对完好。Wang和Bellugi研究了这两组病人的工作记忆能力,测验其词语记忆和空间记忆,发现威廉斯氏综合症病人的数字广度成绩比唐氏综合症病人要好,而唐氏综合症病人的空间记忆成绩比威廉斯氏综合症病人好,两组病人在两种任务的操作上表现出明显的分离。但这并不能得出结论说两种工作记忆存在分离,因为存在这种可能性,即威廉斯氏综合症病人的空间性知觉编码能力存在缺陷,而恰好唐氏综合症病人的词语性知觉编码能力存在缺陷。这是运用双分离原则但是由于没有注意更基本的实验设计问题而导致失败的一个研究。
此外,假使设立健康人作对照组,仅通过病例PV的测查结果(其词语工作记忆较差,但空间工作记忆能力正常)也并不能明确地得出词语工作记忆与左半球有关这一结论,因为存在这种可能性,即PV的词语工作记忆能力也是正常的,只有由于词语工作记忆的测验相对于该病例而言较难。因此,基于所谓的“单分离(single dissociation)”原则下结论要承担较大风险。可以说,双分离原则有很强的说服力。若将双分离原则进一步应用于脑功能成像研究可明确表述为:若A任务只与脑区a而非脑区b的神经活动变化有关,任务B只与脑区b而非脑区a的神经活动变化有关,则这两个任务存在不同的脑机制。显然,在脑生理水平,双分离原则为分离复杂的心理过程提供了逻辑基础。
结论:
心理实验研究以反应时、正确率等行为指标,采用双任务法 (dual task)、过程分离法 (process dissociation procedure)等方法对心理过程进行分离达到对人类认知过程的了解,对阐明人类心理过程是成功的。这两类方法目前已成为探讨人类心理过程的常用方法,但它们是行为实验研究中的一般性方法。行为实验研究还包含更具体的实验设计,这方面在认知心理学等教材有不少介绍。
总体的结论
实验设计可以使问题阐明更清晰。但创造仍来自于构想与假设。通过理论假设、实验检验、修正理论、进一步的验证,如此反复才能阐明问题。
从特殊到一般的道路是直觉性的,从一般到特殊的道路则是逻辑性的。
理论假设来自于创造性直觉,这种直觉建立在经验事实的积累、知识的联系与沟通的基础上,但大胆的假设必须通过小心的求证才能避免浪漫与狂放不羁。
有些问题采用实验法反而无法研究,如“集体无意识”问题,这需要其他研究方法的补充,如质的方法(现象学、解释学等)。因此,经验的观察是与实验法并列的同样重要的方法。