二、心理实验的变量与设计
(一) 心理实验的含义与基本形式
1.实验法的概念
在控制条件下对某种行为或者心理现象进行观察的方法称为实验法。在实验法中,研究者可以积极地利用仪器设备干预被试者的心理活动,人为地创设出一些条件,使得被试者做出某些行为,并且这些行为是可以重复出现的。
2.实验法的特征
与其他研究方法相比,实验法的显著特点是:①要操纵或控制变量,人为地创设一定的情境;②基本目的在于揭示变量之间的因果关系;③有严格的研究设计,包括被试选择、研究的测量和工具、实验程序、设计分析方法等,以保证实验结果的科学性。
3.实验法的分类
根据心理学实验研究目的的不同可分为探索性实验和验证性实验;根据实验情境的不同可分为实验室实验和现场实验;根据实验设计的不同可分为前实验、真实验和准实验;根据实验中自变量的数量的多少可分为单因素实验和多因素实验等等。
(二) 心理实验中的变量及其控制
1. 自变量的种类与控制
自变量:即刺激变量,由主试选择、控制的变量,决定着行为或心理的变化。
自变量的种类:
刺激特点自变量:刺激的不同特性会引起被试不同的反应。
环境特点自变量:进行实验时环境的各种特点如温度、是否有观众在场、是否有噪音、白天或夜晚等等,都可以作为自变量。时间这个自变量在记忆研究中是如此重要和无时不在,你甚至可以说,几乎没有不用时间作自变量的记忆实验。
被试特点自变量:一个人的各种特点,如年龄、性别、职业、文化程度、内外倾个性特征、左手或右手为利手、自我评价高或低等等,都可以作为自变量。
被试的暂时差别:通常是由主试给予不同的指示语造成的。
对自变量方面的控制
①对自变量规定操作定义。实验中规定操作性定义有很多好处,可以使研究者的思考具体而清晰;可以增进科学研究者之间沟通的正确性;可减少一门学科所用概念或变量的数目。
②检查点的确定。心理学研究中的自变量,有些有质的区别,是连续的,例如不同的感觉通道,不同的学习方法等,这些不同的质就是不同的检查点,或称为实验处理。一般检查点确定在三到五个为宜。
③仪器的校准。实验中对仪器的控制要求是:仪器不仅能对自变量的操作达到严密准确,同时也应具有控制无关变量的能力。
④控制呈现刺激方式。包括呈现时间的长短、呈现的顺序、空间位置等,都应根据要求加以控制。
2. 因变量的种类与控制
即被试的反应变量,它是自变量造成的结果,是主试观察或测量的行为变量。
因变量指标有:①准确性方面的指标,正确率;②速度或敏捷度方面的指标;③刺激的强度水平;④概率或频率;⑤反应的强度或力量等。
对因变量方面的控制
①对反应规定操作定义。规定反应变量的操作性定义便于数量化,但是同时要注意指标的单一性偏差。
②反应变量应具备的条件。实验中的反应指标一般需要具备几个特征:指标要具有有效性;要具有客观性;指标要能够数量化;指标要能够精确地、真实地度量反应的变化。
③反应指标的平衡。
3. 无关变量及其控制
对无关变量的控制
①对部分被试变量()及暂时被试变量的控制方法。
如指导语
主试对被试的态度
双盲实验
实验组、控制组
减少被试差异或扩大人数等。
②对环境变量及部分被试变量的控制方法:
消除无关环境变量
保持无关变量恒定
通过实验组和控制组实验结果的对照达到平衡的效果。
随机化法。随机化分配被试,利用数学概率原理,从理论上使各个处理条件下的情况相似。达到平衡误差的目的。
利用ABBA或者AB法平衡。采取抵消、循环法,利用实验顺序的变化抵消平衡实验误差。
统计方法的运用。在实验数据的统计分析中充分考虑实验误差的影响。通过统计方法观察实验可能存在的误差。
补充:
变量的操作性定义
1. 操作定义及其特征、作用
在研究中,对研究变量作出明确定义有两种方式:一是抽象定义,指对研究变量或指标本质的概括,以揭示其内涵,并将其与其他变量或指标区别开来;二是操作定义,指用可感知、度量的事物、事件、现象和方法对变量或指标作出具体的界定、说明。操作定义的最大特征就是它的可观测性,作出操作定义的过程就是将变量或指标的抽象陈述转化为具体的操作陈述的过程。
实验中给出操作性定义有三个好处:①可以使研究者的思路具体而清晰;②可以增进科学研究者之间沟通的正确性;③可以减少一门学科所用概念或变量的数目。
2. 操作定义设计的原则与方法
在对自变量规定使用操作性定义时,要特别防止操作性定义单一性偏差,影响研究的构想效度。
设计操作定义常见的方法有:①方法与程序描述法,即通过特定的方法或操作程序给变量或指标下定义的一种方法,如“疲劳”可定义为连续工作8小时后个体存在的状态;②静态特征描述法,即通过描述客体或事物所具有的静态特征给变量下定义的一种方法,如“聪明”可定义为学识渊博、语言词汇量大、思维敏捷;③动态特征描述法,即通过描述客体或事物所具有的动态特征给变量下定义的一种方法,如“好学”可定义为经常上自习、进图书馆、进书店、看报纸和电视等。
(三) 实验设计
1. 实验设计及评价标准(孟老师,pg30)
(一)研究设计的内容
研究设计的内容包括:①明确研究目的、选择研究对象;②选择研究方法与设计方式;③确定研究变量与观测指标;④选择研究工具与材料;⑤制定研究程序与选择研究环境;⑥考虑数据整理与统计分析的方法。
2. 前实验设计与事后设计
前实验设计是最为原始的。基本类型有:
1. 单组后测设计
这种实验设计,它对任何无关变量都是对一组被试实施实验处理,然后再对其进行观测,以评价实验处理的效果。该设计由于未控制无关变量的干扰和影响,因而难以得出因实验处理而引起实验结果的结论。
2. 单组前后测设计
在实验处理之前增加了一次前测,通过前测可以获得所抽取样本的最初水平或心理特征,再与单组后测结果进行比较,以分析实验处理的效应。该研究设计的结论也缺乏可靠性,因为其中可能存在练习效应以及历史、成熟因素的影响。
3. 对照组比较设计
除了接受实验处理的实验组外,另外设置了一个不接受实验处理的控制组,因而可在一定程度上控制历史、成熟和统计回归等无关因素。但是,在该设计中,实验组与控制组被试的选取和分配不是随机的,而且没有前测,因此也不能肯定地将实验组和控制组后测的差异归因于实验处理。
3. 准实验设计
准实验设计是介于前实验设计和真实验设计之间的实验设计,它对无关变量的控制比前实验设计要严格一些,但不如真实验设计控制得充分和广泛。
1. 时间序列设计
时间序列设计是指对一组非随机取样的被试实施实验处理,并在实验处理前后周期性地做一系列测量,然后分析前后测量是否具有连续性,从而推断实验处理的效果。其基本形式为:一系列前测呻实验处理斗一系列后测。时间序列设计的可能结果如图1—3—1所示。A图中前后测量结果基本上都是连续的,表明实验处理无效;B图中前后测量结果不连续,表明实验处理有效。其中,第一种情况有稳定的正效应,第二种有短暂的作用,第三种有负效应。由于采用了一系列前测,时间序列设计对于成熟、历史和测验效应均有了一定程度的控制。时间序列设计多用于小样本实验,结果一般采用t检验进行考察。
图1—3—1 时间序列设计的可能结果
2. 相等时间样本设计
相等时间样本设计是指对一组被试抽取两个相等的时间样本,前一个时间样本里出现实验变量,而在后一个时间样本中不出现实验变量,其基本形式如下:通过比较多次测量的差异,可检验实验处理的效果并分析实验安排的顺序效应。相等时间样本设计可有效控制历史因素的影响,但外部效度不高。它一般适用于一次实验处理对被试序列、行为只有暂时影响的研究,如某些行为的矫正研究。
3. 不相等控制组前后测设计
这种设计的基本形式如下:
实验组:前测 →实验处理→后测为
控制组:前测 →后测
由于采用了控制组和前后测,不相等控制组前后测设计控制了历史、成熟、测验等因素,比前实验设计完善了一步。但是,它还不如真实验中的前后测设计。因为在不相等控制组前后测设计中被试不是通过随机抽取的,只是采用原有的静态组,实验组和控制组之间可能存在选择偏差。其统计分析一般是采用独立样本的厂检验和协方差分析,将两组前后测的分数变化进行比较,从而估计出实验处理的效果。
4. 不相等实验组控制组前后测时间系列设计
这种设计的基本形式如下:
实验组:一系列前测→实验处理→一系列后测
控制组:一系列前测→一系列后测
可见这种设计既采用了序列前后测又设置了非随机分配的控制组,能更好地控制成熟和历史的因素,而且测验的练习效应和敏感性也能得到有效的平衡和控制。
5. 分解样本前后测设计
这种设计的基本形式如下:
A组:前测 →实验处理→后测
被试
B组:前测 →实验处理→后测
从形式上看,这种设计是将前实验设计的单组前后测设计进行两遍,比较适合于不能一次使所有被试都接受处理、但要求最终所有被试都接受处理的情况。
6. 修补设计
修补设计实际上是将两个不同的前实验设计结合在一起。其基本形式为:
A组:实验处理→后测
B组:前测 →实验处理→后测
4. 真实验设计
真实验设计
真实验设计就是通常所说的实验设计,其特征在于对影响内部效度的无关变量采取了严格的控制并有效地操纵研究变量。根据被试接受实验处理的情况,真实验设计可分为被试问设计、被试内设计和配对组设计三大类。
1. 被试间设计
即每个被试只接受一种自变量水平的实验处理,不同的被试接受不同的自变量水平的实验处理。在这种设计中由于被试是随机取样并随机安排接受不同的实验处理的,因而又称完全随机化设计;各实验处理组之间不相关,因而又称独立样本设计。被试间设计的数据在统计分析时,通常是对实验组和控制组的结果进行差异显著性检验或方差分析。被试问设计可以分为后测设计、前测后测设计和所罗门四组设计(又称重叠实验设计)等几种类型,它们可以分别用以下的模式表示。
后测设计:
实验组:随机取样( )→实验处理→后测
控制组:随机取样( )→后测
前测后测设计:
实验组:随机取样( )→前测 →实验处理→后测
控制组:随机取样( )→前测 →后测
所罗门四组设计:
实验组1:随机取样→前测 →实验处理→后测
控制组1:随机取样→前测 →后测
实验组2:随机取样→实验处理→后测
控制组2:随机取样→后测
2. 被试内设计
被试内设计是指每个或每组被试接受所有自变量水平的实验处理的真实验设计。又称“重复测量设计”。如果用被试组代替单个被试,每组都要接受所有的实验处理,但组中的每个被试随机地接受一种实验处理,这样的组叫区组,这种设计称为“随机区组设计”。同一区组内的被试应尽量“同质”(即在各方面都相似或相同)。随机区组设计的实验处理之间相关,因此又称“相关样本设计”。被试内设计将被试的个别差异从被试(组)内变异中分离出来,提高了效率。对于容易导致的练习或疲劳效应,通常采取全随机法、对抗平衡法(ADUA)、拉丁法等方法予以消除。被试内设计可分为完全和不完全被试内设计两种,两者的区别在于每个或每组被试接受所有的还是部分的实验处理。结果可用方差分析处理。
3. 配对组设计
实验组→实验处理→后测
前测 斗配对十随机分组
控制组→后测
从中可见,配对组设计既具有被试间设计的某些特点,如每组被试接受一种实验处理,又有被试内设计的特点,即实验组与控制组同质。
完全随机单因素设计;完全随机多因素设计;随机区组设计。
(可以参阅舒华老师《心理与教育研究中的多因素实验设计》北师大出版社)
多因素设计的优越性!
1. 做一项有三个自变量的实验比分别做三个实验的效率要高。
2. 做一项实验比分别做三项实验易于保持控制变量恒定。
3. 也是最重要的,在几个自变量同时并存的情形下所概托的实验结果比从几个单独实验所概括的结果更有价值,更接近生活实际。
4. 一项实验中有两个或两个以上自变量,当一个自变量的效果在另外一个自变量的每一水平上不一样时,我们就说存在着(自变量的)交互作用。
(四) 实验研究的效度
1. 内部效度与外部效度
2. 内部效度的影响因素
研究的内部效度是指在研究的自变量与因变量之间存在一定关系的明确程度。如果自变量和因变量之间关系并不会由于其他变量的存在受到影响,从而变得模糊不清或复杂化,那么这项研究就具有内部效度。要使研究有较高的内部效度,就必须控制各种外部变量,消除它们对研究结论的影响。这些外部变量通常有成熟因素、历史因素、被试选择上的差异、被试缺失产生的效应、前测效应、实验程序不一致或处理扩散产生的效应、统计回归效应、多种研究条件与因素间的交互作用等。
3. 外部效度的影响因素
研究的外部效度是指研究结果能够一般化和普遍适用到样本来自的总体和到其他总体中的程度,即研究结果和变量条件、时间和背景的代表性和普遍适用性。外部效度可以细分为总体效度和生态效度两类。要提高研究的外部效度,应注意在研究中消除和控制如下因素:①被试的代表性差;②操作定义不明确;③研究对被试的反作用;④事前测量与实验处理的相互影响;⑤多重处理的干扰;⑥实验者效应;⑦研究与实际情境相差较大;⑧被试选择与实验处理的交互作用。
补充:
构思效度是指理论构思的合理性及其转换为抽象与操作定义的恰当性程度。要使研究有较高的构思效度,应做到:①理论构思必须结构严谨、符合逻辑、层次分明,形成某种“构思网络”;②严谨地对各种变量做出明确、严格的说明;③给变量下明确的操作定义,并制定相应的客观测量指标;④消除或控制各种影响因素,如构思水平之间的混淆、主被试效应等。
统计结论效度是关于研究的数据分析处理程序的效度检验,或者说,它是检验研究结果的数据分析程序与方法的有效性的指标。统计结论效度的基本问题是研究误差、变异来源与如何适当地运用统计显著性检验,它不涉及系统性偏差的来源问题,而是研究误差变异情况和如何适当运用统计显著性检验的问题。要提高统计结论的效度,首先必须保证数据的质量;其次要明确各种统计检验方法的基本假设和适用条件,选用适宜的统计程序;此外还应注意适当增大样本的容量。
补充:
研究评价的基本问题
(一)研究评价的意义
研究评价主要有以下几方面的意义:①有助于认识研究结果的价值;②有助于研究成果的交流;③从科研管理来看,有助于科研资助或管理机构的决策;④有助于研究结果的应用和推广;⑤研究评价是整合局部研究成果的基础,有利于学科研究体系的完善和系统化。
(二)研究评价的内容
评价心理学研究的科学性,主要有以下几方面的内容:①研究所依据的理论或观点的合理性;②研究方法的恰当性和新颖性;③研究结果的可靠性;④研究解释的恰当性;⑤研究结论的概括性;⑥研究的理论和应用价值。
(三)研究评价的方法
从方法的性质上,研究评价主要有两种方法,即理论思维方法和评价技术或方法。前者指分析与综合、比较与分类、抽象与概括等理论方法;后者指具体的评价技术或方法,如研究报告的评价方法、内容分析和元分析等方法。从评价的范围上,研究评价主要有针对某一项研究的单个评价和涉及大量同类研究的综合评价。前者一般通过研究报告的阅读和评价来进行;后者常采用内容分析和元分析的方法进行。从科研管理或评定者的组成上,研究评价主要有自我评价和他人评价。前者一般以研究报告总结的形式出现;后者指有关专家对研究进行的评价,如成果鉴定会、评审会等。
二、研究报告的阅读与评价
(1)问题提出部分。比如作者要解决什么问题;该研究要检验的假设是什么等。
(2)研究方法部分。比如作者的研究方法是否能够检验研究假设;研究的自变量、因变量和无关变量是什么,被试如何取样,是否合理等。
(3)结果部分。比如将该研究获得的结果与自己预测的结果进行比较,若一致,试问自己将如何解释这一结果。
(4)讨论部分。将自己对结果的解释与研究者的解释相比较,当出现不同时,要思考为什么自己不那样解释或者为什么作者不那样解释?
(5)结论。主要是判断结果的概括性,即结果的普遍推广程度。
除此之外,还需要从报告格式规范、行文要求等方面进行评价。