效度是指研究结论的真实性程度和有效性程度,是衡量实验成败优劣的核心指标。内部效度与所得结果的唯一性有关,外部效度与结果的可推广性有关。
一、内部效度
定义:内部效度表示实验所提供的自变量与因变量之间因果关系明确程度的一种指标。
解释:如果研究结果有且只有一种解释,那么该研究的内部效度就高;如果研究结果不止一种解释时,该研究的内部效度就低。因此,研究过程中所有导致对结果有其它解释的因素,都是对内部效度的威胁。比如,变量X的变化总是一贯地、明显地伴有变量Y的变化,如能肯定变量X的变化是引起变量Y变化的直接原因,那么这个研究就具有高内部效度。相反,任何其它可能引起变量Y变化的因素都是对其内部效度的威胁。
举例:
一项研究要测量室温与问题解决能力之间的关系。假定结果为:温度上升时,被试成绩有明显下降。
过程如下:将一组被试60人安排在20度的房间中,然后升温至30度,再升至35度,每一温度下都给出问题让被试解决,并测量他们的成绩。
结果显示:温度上升时成绩就下降。实验结果很明确,但结果的解释却出现了不确定性,因为成绩的下降可能是温度上升引起的,也可能是被试在连续作业中产生的疲劳引起的,这两种解释使内部效度受到了威胁。
而后研究者对实验进行了改进:在每种温度下使用一个独立的被试组,以期排除疲劳因素的影响。首先将第一组20人安排在2O度条件下参加实验,接着是第二组20人安排在30度条件下参加实验,最后的一组20人安排在35度条件下参加实验。结果仍显示:温度上升时成绩下降。至此,除温度外,被试的组间差异、各组间被试的个体差异也可能导致这一结果,这时也存在两种甚至两种以上的解释。尽管研究者可以宣称问题解决的能力与温度有关,但这种解释的内部效度却存在疑点,即内部效度不高。
研究者想用温度和问题解决能力间可能存在的因果关系来解释假定结果,即温度升高引起问题解决能力下降。就内部效度而言,需要考虑除温度外,是否还有其它可能的因素引起被试问题解决能力的下降。初次实验中存在的不可控因素导致了解释的非唯一性,致使内部效度较低,改进后的实验虽有的放矢,但仍使研究潜入了额外变量,造成了变量混淆。
由此可见,任何伴随自变量变化或实验处理出现的额外变量都可能导致内部效度的下降,如被试差异、实验者差异、环境差异、测量的顺序效应等。
要提高研究的内部效度,就要加强对额外变量的控制,防止除自变量以外的其它任何因素成为混淆因子。
二、外部效度
定义:外部效度是指脱离研究情境以后,研究结果还能成立的程度。
解释:每一项研究都是在特定的时问和地点进行的,有特定的被试、指导语、测量技术和实验程序。尽管研究本身具有特异性,但研究者通常期望研究结果不是特异的,可以推广到研究情境之外。
每一项研究的目的都期望反映自变量与因变量问存在的真实关系,任何制约结果通用性的特征都是对外部效度的威胁。如果研究结果能同样适用于特定实验范围之外的其它时间、情境和人群,则认为此研究具有外部效度;相反,如果结果仅限定在约束条件内,则缺乏外部效度。会对外部效度造成损害的因素一般包括被试者特征、主试者特征、研究的操作程序和测量方法等因素。这些因素的特异性越强,越有可能导致研究情境与人们日常生活情境的差异性增大,使研究情境中观测到的被试行为区别于人们日常生活情境中的行为,也就制约了研究结论的可推广性。
举例:
Strack.Martin& Stepper主持的一项研究表明:在牙齿间放一支笔(迫使其微笑)的人与在嘴唇间放一支笔(迫使其皱眉)的人相比,前者比后者更有可能认为卡通片有趣。这项研究是用伊利诺斯州大学生为被试的,但研究者认为这一结果可以推广到实验范围之外,因为此研究仅涉及到人类共通的生理指标,反映的是人的表情-情绪-认知之间的一致性程度。可以说,如果其他人在不同的时间和地点来接受测试,应该也会得到相同的结果,因此该实验结果的外部效度不存在多大异议。
三、内部效度与外部效度的关系
内部效度是外部效度的必要条件,但不是充分条件。
内部效度低的研究结果就谈不上对其它情景的普遍意义;可是内部效度高的研究,其结果却不一定能够一般化到其它总体和背景中去。教育科学研究的重要意义是要发现教育活动的普遍规律,指导教育工作的开展。因此,提高研究结果的外部效度十分重要。
一项研究的内部效度再高,如果其结果仅适应于特定的范围,特定的测量工具、特定研究程序和特定的研究条件等,那么,从获取一般知识和揭示普遍规律的角度来看,其价值、意义不大。因此,研究的外部效度与内部效度在重要性上毫不逊色。