第三节测验的信度
第一单元信度的概念
信度定义:指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致性程度。信度只受随机误差的影响,随机误差越大,信度越低。系统误差产生恒定效应,不影响信度。
在测量理论中,信度被定义为:一组测量分数的真分数方差与总方差(实得分数的方差)的比率,信度指数的平方就是信度系数。测量的标准误SE=,信度系数越高,标准误越小;信度系数越低,标准误越大。
第二单元信度评估的方法
㈠重测信度
定义:又称稳定性系数,即使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。
优点在于能提供有关测验是否随时间而变异的资料,可作为被试将来行为表现的依据。缺
点在于易受练习和记忆的影响。重测信度两次测量最适宜的时距随测验的目的、性质和被试特点而异,一般是两周到四周较宜,间隔时间最好不超过六个月。
㈡复本信度
定义:又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。复本信度反映的是测验在内容上的等值性。
优点是能够避免重测信度的一些问题,如记忆效果、学习效度等。局限性:其一,如果测量的行为易受练习的影响,则复本信度只能减少而不能完全消除这种影响;其二,由于第二个测验只改变了题目的内容,已掌握的阶梯原则,可以很容易地迁移到同类问题。最后,对于许多测验来说,建立复本是十分困难的。
㈢内部一致性信度
内部一致性信度系数主要反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。
⑴分半信度:
通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。这个相关系数就代表了两半测验内容取样的一致程度。在其他条件相同的情况下,测验越长,信度越高。
⑵同质性信度
同质性主要代表测验内部所有题目间的一致性。
㈣评分者信度
用于测量不同评分者之间所产生的误差。一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为是客观的。
原则上一个测验那种误差大,便应该用哪种误差估计。
第三单元信度与测验分数的解释
一般的能力测验和成就测验的信度系数都在0.90以上,有的可以达0.95;而人格测验、兴趣、态度、价值观等测验的信度一般在0.80~0.85或更高些。
责任编辑:刀刀