目录
1. 变量存储类型
在软件中,变量分为数值型变量、字符型变量等。
一般而言,数值型变量包括数字、小数点等,而不能含有字母或文字。
2. 变量值范围
检查每个变量的取值范围。
例如:一个人的体重不能为负数;出生月份应在1~12之间;某成年男性的身高值低于140cm或者高于210cm也值得怀疑。
3. 有效值检查
检查观测值是否为事先定义的数值之一。
例如:录入性别时,事先规定用1表示男性,2表示女性,出现其他观测值则说明有误。
4. 一致性检查
检查有无前后矛盾,相关问题的逻辑是否一致。
例如:出院日期早于入院日期、收缩压小于舒张压等就不符逻辑。
5. 唯一性检查
在录入数据时,一般而言,每个观察单位通常都设有一个唯一的标识号。
例如:调查对象编号、住院号、门诊号等。
根据标识号检查是否存在同一个观察单位的数据两次重复录入。
6. 完整性检查
检查每一个观察单位的完整性和整个数据库的完整性。
例如:在问卷调查中,往往根据问卷的完成情况定义有效问卷,比如完成80%即视为有效问卷。同时,需要注意每个变量在整个数据文件中的缺失比例,这是数据质量的一个重要方面。
7. 交叉检查
不同来源的两个数据库中同一内容的信息应该一致。
通过检查不同来源的数据的一致性,可快速验证数据的可信度。