信效度解读：信度、效度的概念与类型

调研家SurveyPlus

标签：信度效度

2025-03-20

信度效度

信度和效度是衡量测量工具科学性和合理性的重要指标。无论是学术调研还是商业市场调研，理解信效度对于提升研究结果的科学性和可信性都至关重要。那么，信效度具体是什么？我们通常都关心哪些类型的信效度呢？今天我们的文章就来介绍一下这两个问题。

一、什么是信度和效度？

信度（reliability）用于衡量测量工具或方法的稳定性，即在相同条件下重复测量时，能否获得一致的结果。例如，如果一份问卷在不同时间点对同一组人测量结果差异很大，则说明其信度较低。效度（validity）关注测量工具或方法能否准确地测量目标概念，即是否测量了研究者真正想要研究的问题。比如，一份旨在评估用户满意度的问卷，却更多地测量了用户的购买频率，这就是效度不足的表现。

人们通常以打靶图来描述信度和效度这两个概念。如果我们将不同次打靶的结果视为多次测量的结果，将靶心视为测量的目标，那么不同次打靶落点位置的一致性反映了信度，而落点与靶心的距离则反映了效度。

社会科学研究中经常需要测量一些抽象的概念，比如自尊心，幸福感，同理心等，其中有些抽象的概念可能还需要通过多维度的指标来进行综合测量。为了测量这些概念而使用到的测量工具（通常指量表）并不能随意设计，必须同时保证信度和效度两个要素。

二、信度的不同类型

测量工具的信度受很多因素影响，不同的因素对应不同的信度类型。具体来说，如果我们关心测量工具多次测量的结果是否一致（比如一套心理量表测量是否稳定），我们需要使用同一工具对同一群体在不同的时间点进行至少两次测量，并对两次测量结果进行相关性分析，这种方法所计算的相关系数就是重测信度（test-retest reliability）。

另一种常见类型的信度系数是内在一致性信度（internal consistency reliability），它主要关注测量工具内部多个题目之间的一致性，人们通常通过Cronbach’s alpha这一统计量来检验这一相关性。Cronbach’s alpha的数值一般在0~1之间，数值越大，代表测量工具中各个试题之间的内在一致性越高。

三、效度的不同类型

效度评估的出发点是测量目标的理论框架、维度、它与其他变量之间的关系如何、它能预测什么行为等。明确了测量目标的理论框架，研究者可以从不同角度来评估测量结果与测量目标的符合程度。以下是几种典型的效度类型：

1.内容效度（content validity）

内容效度关注测量内容是否覆盖了目标概念的所有方面。一个测试或调查的测量内容必须覆盖目标测量主体的所有相关部分，才能产生有效的结果。如果测量中缺少了某些方面，研究结论就会出现偏差。

比如说，如果研究者设计了一份问卷来测量受访者的认知能力，但是只包含了数学题，而忽视了其他的认知维度（如语言能力、推理能力等），那么这份问卷的内容效度是比较低的，因为它无法全面反映认知能力这一目标概念。

2.建构效度（construct validity）

建构效度关注测量工具能否准确地测量研究者所要测量的目标概念。研究中的一些抽象的、无法直接观察到的概念或特征，比如智力、焦虑、幸福感等，可以通过观察其他与之相关的指标特征（indicator）来测量。建构效度就是确保我们用以测量的这些指标特征能够真正地反映我们想要测量的概念。

以抑郁为例，现实中并没有一种可以被直接测量的叫做“抑郁”的客观实体，但是基于心理学的研究和理论，我们可以通过一些相关的症状和指征来测量抑郁，比如说缺乏自信、缺少精力等。如果我们设计一份问卷来测量抑郁，我们需要确保这份问卷真正测量了抑郁这一概念，而不是受访者的情绪、自尊、焦虑或者其他一些不相关的概念。