在编制问卷调查时,我们常常需要了解一些人口学变量信息,或者称个人信息、基本信息,如果问卷中人口学变量信息太少则可能会遗漏一些重要的影响变量,而如果人口学变量太多则可能有些是没有必要的却增加了问卷的长度,费时费力又影响被试答题情绪。那这些信息该如何选择?哪些信息应该有,哪些可以没有?
第一,作为研究变量的人口学信息。有些人口学信息不是可有可无、随意增减的,而是基于特定的研究目的和假设,即它也是一种研究变量。例如,如果你的研究目的和假设认为某些个人特征可能影响研究变量,例如工作满意度可能存在性别差异、年龄差异,那么性别、年龄的基本信息必须要有。
第二,作为控制变量的人口学信息。很多研究需要控制人口学变量的影响,以了解主要研究变量的影响,此时人口学变量作为控制变量存在。那选择哪些人口学变量作为控制变量?一般来说,应选择那些理论上公认的或经验上有影响的人口学变量。例如从众行为的研究,如果现有的从众心理、从众行为理论认为性别、智力、文化程度对从众心理有影响,那么问卷中就应该纳入这些变量。再如,如果已有的研究中有不少研究发现从众行为存在性别、文化程度上的差异,那么我们的研究也应该纳入这些变量,反之,那些多数研究都发现对从众行为没有影响的人口学变量(如农村-城市),那么可以不纳入这些变量,如果审稿人或专家评委质疑为何不调查家庭所在地这一人口学变量,那我们就可以举出多个前人研究证明这个变量没有影响。由此提示我们,问卷设计时要先大量阅读已有相关研究,注意人口学变量信息的影响作用。
第三,有时候人口学变量既不是研究变量,也不是需要统计控制的变量,但我们也不能忽略,这主要是考虑到样本结构的报告问题或调查样本的代表性问题。因为理论上一项调查研究应该是随机抽样,各个群体都应该有一定比例的代表,研究报告中也需要说明样本的结构,而一些基本的样本结构信息就不能忽视,即便他们不是我们的研究变量或统计控制变量。例如对职场员工的调查,部门变量是分类变量,难以作为研究变量和统计控制变量使用,但它却是反映样本结构的重要信息,因而应该纳入。
第四,为便于统计分析,人口学变量应尽可能量化。例如,对于年龄、收入此类变量,可以用连续变量或设计为多个等级的等级变量,而职业、部门等无序分类变量建议划分为三五个大类,而不应该设计得太过详细,那样不方便统计处理。