CFPS用户手册阅读记录(基本概念)

1.0基因成员是指调查主体和上一代调查主体具有紧密关系(“血缘/领养子女”),核心成员是指与当代调查主体具有直系家庭关系的对象——“基因成员在家中的非基因直系亲属(父母、配偶、子女)”,非基因是指与上一代调查主体无直接基因传递关系。p9

1.1CFPS 2010 年基线调查的家庭成员概念:把 2010 年这些家庭成员以及他们今后的新生血缘/领养子女全部视为 CFPS 基因成 员。所有基因成员均为 CFPS 永久追踪的对象

“同灶吃饭”指经济联系在一起的家庭和非家庭成员,包括了有血缘/亲缘关系的成员以及在家里工作的 非血缘/亲缘关系的成员如保姆、司机、担任保姆工作的远房亲戚等。p29

家庭成员问卷中收集了非家庭成员的一 些基本社会人口信息。他们与家庭并没有血缘/婚姻/领养的紧密关系,因而不是我们关注的 主要人群,不需要回答个人问卷。他们一旦离开了受访家庭,我们也不会对其进行追踪。p30

2.CFPS 的主体问卷包括村居问卷、家庭成员问卷、家庭问卷、少儿问卷和成人问卷五类。 调查在社区、家庭和个人三个层面进行:

在社区层面,CFPS 通过村居问卷对各样本 村/居进行一个整体的访问,主要了解该村/居的基础设施、人口结构、政策实施、经济情况、 社会服务等信息;

在家庭层面,由一位家庭成员回答一份关于家庭成员信息与成员间关系的 家庭成员问卷(个人问卷产生的前提)以及一份反映家庭整体情况的家庭问卷;

在个人层面,对于符合资格的个人(核心/基因成员), 16 岁以下者回答少儿问卷,16 岁及以上者回答成人问卷。其中,少儿问卷分为代答和自答 两个部分,10 岁以下的少儿,由其监护人回答代答部分问题;10 岁至 15 岁的少儿,除监护 人回答代答部分问题外,本人还需完成自答部可分问题。p23

由变量wh可查看少儿自答数量,下图(2010年少儿库)显示满足10-15岁少儿有3464人,其中回答了后续自答问卷的有3463人。

可通过不存在个人问题情况的相关变量审核家庭成员人数与个人问卷变量数之间的差异:

***模块化的问卷设计使得可能出现大批的空结果。计算机辅助调查系统为我们在访问当中即时调用相关问题模块、建 立个性化问卷提供了方便。比如说,对正在上学的受访者调用上学模块,对有工作的受访者 调用工作模块。我们不对农村和城市分开使用不同问卷也是出于同样的道理。p26

**五类问卷模块排序独立,即每份问卷从A模块开始排序。

问卷与数据库中的变量名基本相符,次序与逻辑顺序一致,综合变量名在问卷中无法找到,并且一般放在数据库末尾。

**另外还有面访/电话访,自答/代答的问卷差异(问题是否完全相同或存在)导致的空值。p78

**有一些判断变量并不出现在问卷问题里,而是在【CAPI】跳转判断里,属于一种综合变量,但一般按照问卷顺序排放。

3.T 表格由 T1、 T2、T3 三张表构成,位于家庭成员问卷的起始部分。T1 表(同住家庭成员表)、T3表(不同住直系亲属表)分别记录全部家庭成员和他们不同住的父母、子女和配偶的基本社 会人口特征, T2 表(“关系表”)则建立起了 T1 表中全部家庭成员之间的对应关系,以及 T1 表成员与 T3 表成员之间的对应关系。

同住 家庭成员列表(T1 表),以“1”开头的三位个人码进行标识。此外,T1 表中也为同住非家庭 成员生成了相关纪录,以“3”开头的三位个人码进行标识。不 同住直系亲属成员列表(T3 表)。T3 表中成员的三位个人码均以“2”开头。p32

T表格构建、编码规则与相关变量 ↓

http://www.isss.pku.edu.cn/cfps/docs/20180927132843624299.pdf

4.从最终形成的数据库来说,追踪调查年的家庭关系与基线数据相比具有如下特点:

(1)从原家庭分离出来的另组家庭成员会在原家庭和另组家庭中均有一条记录,形成 部分个人样本在家庭关系库中存在多个记录的现象。这样的数据库设计是为了反映出家庭成 员在不同家庭间的动态流动过程。用户可以通过 co_aXX_p(XX 代表调查年,如 12,14 等) 变量来判断该名成员经济上应该归属的家庭,其中 co_aXX_p = 1 代表该名成员经济上归属 这个家庭,而 co_aXX_p = 0 则表示该名成员已从这个家庭中分离出来。当我们把数据只限 定于 co_aXX_p = 1 的观测时,只保留了各家庭中“同灶吃饭”的成员,这时每位成员只存在 唯一一条记录,即每位成员在一轮调查中只能经济上归属一个家庭。

(2)由于家庭的分裂和重组,追踪调查年的关系库中不仅有个人调查当年所属家庭的 家户号,还包含该成员在之前调查年所归属的原家庭的家户号。我们在家户号变量名后加上 年份以区别成员在不同年份所归属的家庭(如 fid10, fid12, fid14)。

"CFPS中pid的前六位是样本 初次 进入CFPS时所在的家户号,当你发现同一家户中前六位不同时,说明该家户在某一轮次发生过家户分裂。"

“pid是CFPS中的个人编码,由前六位的家庭样本编码(fid)与后三位的个人家庭内部编码(Code_a_p)合并而成。”

——家庭关系库的相关问题解答 - 知乎 (zhihu.com)

(3)根据家庭的分裂、人员的流动以及存殁,我们对基因成员进一步细分,在追踪调 查年家庭关系库中提供 genetype 变量来指征基因成员的具体类型(如,在家基因成员、新进 基因成员、外出基因成员、死亡基因成员等)。追踪调查年家庭关系库的创建和使用的详细 信息可以参考技术报告《中国家庭追踪调查 2012 年家庭关系原始库的分解与重构(CFPS33)》p77

5.2012 年的调查问卷中也设计了一些问题用以对 2010 年数据中的一 些变量进行了信息确认:① 受访者本人的性别与出生日期。 ② 受访者 2010 年的婚姻状态以及婚姻史中的一些重要时间信息,如,结婚的日期,配 偶的出生日期,婚姻解体的时间,等等。 ③ 2010 年访问时婚姻状态为离婚、丧偶的受访者的上一任配偶的受教育程度。2010 年 T 表格的设计不能获取离婚、丧偶的受访者的上任配偶的教育信息。考虑到这些缺失的信息 对研究家庭和婚姻的学者有用,我们在 2012 年的问卷中对这些信息重新进行了收集。 ④ 教育史相关信息。CFPS 2010 年和 2011 年的设计仅仅收集了 16 岁及以上成人的教 育史信息,而对于 16 以下的少儿,仅仅提问了其最高学历(未在上学者)或正在上学的阶段(正在上学者)的相关信息,并没有收集详细的教育史信息,为此,对于 2010 年和 2011 年都没有回答教育史相关问题的受访者,我们在 2012 年补充收集了相关信息。此外,2012 年的调查问卷还重新确认了 2010 年上学的状态以及正在上学的阶段。⑤ 所有已离校受访者的离校阶段。2010 年问卷设计中对于受教育程度的提问方式是: “您已经完成(毕业)的最高学历是什么?”这实际上忽视了中途离校/辍学的受访者最后一个 阶段的学校教育,使得他们的受教育程度被低估。为了准确估算受访者的受教育程度,2012 年对所有已经离校的受访者重新收集了这方面的相关信息,关于受教育程度具体使用的题目 是:“您从哪个阶段离开学校?” ⑥ 受访者的父母信息,含父母的出生日期、职业、教育与政治面貌。CFPS 2010 没有 收集已经去世父母的上述信息,为了弥补 T3 表数据上的缺陷,2012 年我们重新收集了所有 人的父母信息。

在 2012 年调查结束后,我们利用采集到的以上信息对 2010 年的数据进行了更新。研究 者在后期发布的 2010 年更新数据版本中将可以使用到更新后的数据,也可以根据研究需求 参考 2012 年的相关数据自行调整与补充。

----------------------------------以下最好重新阅读文件,根据需要重点阅读--------------------------------------

6.综合变量:经CFPS进行数据清理后的重要变量的清理或来源。需注意:综合变量的不适用情况有可能是由于往年已采集,体现在往年数据中,当年数据不显示,应当进入数据清理报告中查看。p82-100

7.最佳变量:对部分需要修正的变量没有进行直接修改,而是在原始变量 的基础上生成一组新的变量来保存修改后的值,以供用户参考,原变量同样保留并发布。由 于新生成的变量是我们参考数据中各方面的信息得出的最合理取值,所以我们将其命名为 “最佳变量”,变量名的命名规则为:在原变量名之后加上后缀“_best”。用户需要注意的是: “最佳”并不意味着是一定正确的取值,而是我们在已有填答的基础上,结合多个信息来源与 逻辑关系判断在目前所能得到的最合理取值。p101

8.特殊数据保护:不公开变量p103

9.需特别注意而前文未说明的变量p104

10.CFPS数据评估:CFPS 与CGSS、CHFS 的对比,关于数据偏差的部分需要重点注意。第八节

11.权数相关说明。基线权数、追踪权数、截面权数。追踪年的追踪权数仅对 2010 年的初始 基因成员进行加权调整,追踪年的截面权数包含 2010 年的基因成员和之后新进基因成员两 部分。追踪权数和截面权数的权数调整均包含个人权数调整和家庭权数调整。CFPS 的总样 本包括六个子总体,我们对各个样本框分别进行权数调整。p119第九节 可参考技术报告《中国家庭追踪调查2010 年基线调查权数计算(CFPS-17)》

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值