12、以测量标准误表示信度的好处是:
(1)信度的单位与测验分数的单位相同,因此解释个人分数时非常直接,能直接指出允许测验分数变化的范围。
(2)测验同质与否并不影响测量标准误的大小。测量标准误的不足之处时:无法比较不同测验间的信度高低。比较不同测验的信度用信度系数(rxx)解释个人分数时用测量标准误(SE)。
13、常见的影响信度的因素有:样本特征、测验的长度、测验的难度、测量的时间间隔等。
14、我们做信度考验时,常常选取一个与常模样本性质相同的样本施测,根据被试得分求出信度系数。
(1)样本团体得分分布的影响:求信度的样本团体得分分布如果比较窄小的话信度就低。
(2)样本团体异质性的影响:样本团体异质的话,测验分数的分布就比同质样本的要广,分数的离差就大,样本的方差就大,信度就高。实际上,高信度可能是假性高信度,是由样本团体的异质造成的。但如果常模总体要求各种各样的人,则异质的信度样本求得的信度就是真信度。这时,相反的情况就需要校正信度。
(3)样本团体平均能力水平的影响。由于信度也会因样本间团体平均能力水平的不同而不同,因此在求信度时,一定要注意信度样本与常模总体间是否一致。
15、测验的长度:在其他条件均等的情况下,测验越长,信度越高。原因在于:
(1)测验越长,即题目越多,测验的内容取样就越有可能有代表性。
(2)测验越长,被试的猜测因素影响就越小。
16、测验的难度:难度对信度的影响之存在于某些测验中,如智力测验、成就测验、能力倾向测验、教育测验等。测验的难度对信度有间接影响,因为如果测验过难,被试的得分会集中在低分区。过于容易,分数则集中在高分区。两种情况都使信度样本的得分范围变窄,变异量降低,从而低估测验信度。
17、测验的时间间隔:这一因素之对重测信度和不同时测量时的复本信度有影响,对其余的信度来说不存在时间间隔问题。
第6章效度
1、效度是指:测验能测量到所要测量的对象的程度。这一定义包含着两层含义:测验测量什么?测验对测量目标的测量精确度和真实性是多少?
2、效度的公式为:rxy = SV2/SX2它是与测量目标有关的真实分数方差与总方差的比率。其中rxy是常用的效度表示法;SV2是“有关的真实方差”,也就是由测验所要测量的心理变量引起的方差,也叫有效方差;SX2是总方差。
3、信度和效度的差别是:两者所涉及的误差不同:信度仅考虑偶然的随机误差占测验总变异的比例,效度则还包括与测验无关的但稳定的测量误差。
(1)信度是效度的必要而非充分条件。
(2)效度是受信度制约的。
4、效度的性质:效度的真实含义是指测验结果的效度,也就是测验结果的准确程度。
(1)效度具有相对性。
(2)效度具有连续性。测验的有效性只有程度上的差别。
(3)效度也不是直接就可以测量到的,它是从已有的证据推理而来的。
5、效度的种类:内容效度、构思效度和效标关联效度。
6、效标关联效度是指:测验总分数与外在标20、准(效标)之间的相关程度,反映的是用测验预测个体在某种情境下行为的表现如何的有效性程度。由于外在标准成了考察测验有效性的参照标准,因此简称为效标。
7、阿斯丁把效标分为两个层次:一是理论描述水平的“观念效标”,二是操作定义水平的“效标测量”。
(1)观念效标是效标的理论定义,效标测量是效标的操作定义,效标测量必须能真正反映观念效标。
(2)效标测量的一个重要特征是客观性。为此因做到:
1避免偏见影响效标测量,特别是以等级评定为效标4测量时,评分者的主观偏见会有很大影响。
2防止效标污染,即指个人的效标因评定者知道个体的测验分数(也叫预测源分数)而受到影响。
8、常用的效标:学业成就、临床诊断、实际工作表现、特殊训练成绩、效标团体比较、先前有效的测验、等级评定。
9、同时效度:它的效标资料是和测验分数差不多同时搜集的。一般情况下,它可以代替预测效度。
10、预测效度的效标是经过一段时间以后才获得的,预测效度反映的是从测验分数预测任何效标情境或一段时间后被试的行为表现的程度。
11、构思效度就是:心理测验对某一理论概念或特质测量的程度。因此,研究构思效度就是要搞清楚:测验测量的是什么构思(概念或特质)?测验分数的变异中有多少来自于测验的理论构思?构思效度是没有单一指标的,它是由各方面证据累积起来作出评价的。
12、确定构思效度的基本步骤:建立理论框架、根据理论框架推演出有关测验成绩的假设、用逻辑或实证的方法来证明假设。
13、确定构思效度的方法:测验内部的方法、测验间的方法、效标效度的研究、实验和观察法验证。
(1)测验内方法:这类方法是通过研究测验内部结构来界定理论构思,从而为构思效度提供证据。
(2)确定方法是:分析测验的内容效度和测验的内部一致性分析。测验的内部一致性可以由分半信度、α系数、KR20或KR21等指标来衡量,它们考察的是测验题目是否同质,分测验与总测验是否一致或同质,这些都可以证明测验所测量的构思是否合理,因而构成了证实构思效度高低的证据。
(3)有时分析被试对题目的反应特点也可以作为构思效度的证据。
(4)测验间的方法:通过分析几个测验间的相关关系,找出其共同之处,进行推断这些测验测量的特质是什么,也可以确定这些测验构思效度如何。最简单的方法是计算两种测验之间得分的相关。区分效度是构思效度的又一个证据。因素分析法也是建立构思效度的常用方法。
(5)实验法和观察法证实:观察实验前和实验后分数的差异也是验证构思效度的方法之一。
14、内容效度是指:测验题目对有关内容或行为总体取样的适当性程度。因为这种效度主要是考察测验的内容,因此叫内容效度。
(1)要想使测验的内容效度高,必须又两个条件:内容的范围或行为总体必须界定名确;测验题目应该是所界定的内容范围的代表性样本。
(2)内容效度的确定方法:专家判断、经验判断、统计分析法。
15、表面效度是指:一个测验看起来好象是测量所要测的东西的程度。换句话说,当那些未经过训练的被试或测验应用者认为某测验是有效的测验时,该测验就有表面效度。
16、效度的指标是指:效标关联效度和构思效度的的指标。效度指标一般有:效度系数、统计推断参数、预期表等。
17、效度系数:它是最常用的效度指标,尤其是效标关联效度。它是以皮尔逊积差相关系数来表示的。效度系数的实际意义常以决定性系数来表示,表达式是rx2y,效度系数的平方就是决定性系数,测验正确预测或解释的效标的方差占总方差的比例。
18、效度的其他指标:一些描述不同团体的差异的统计指标(参数)也可以作为效度的指标,比如:t考验、F考验、重叠百分比等。
19、效度的影响因素:测验本身的因素、测验施测的样本的性质、效标的性质等。
(1)对于测验本身因素又可分为:测验题目的质量、测验的长度、测验实施中的干扰、被试的因素等。
(2)样本的性质:
1影响之一是:不同的团体对同一测验的反应可能会不一样,因被试的背景不同,对测验的题目可能采取完全不同的方法来回答。
2、响之二是:同一个测验,效度团体的性质不同,效度也会有很大差别。效度团体的性质包括年龄、性别、教育程度、智力水平、动机、职业等有关的特点,1这些性质特点使测验对不同的团体具有不同的预测能力。故称为干涉变量。
3影响之三是:样本团体的异质性。其他条件相同的时候,样本同质性越高,效度越低。