Valuing the urban hukou in China: Evidence from a regression discontinuity design for housing prices【chen et al. 2019】
From:Journal of Development Economics
- 「户口值多少钱?」这是个颇具中国特色的问题。
Chen et al. (2019) 以济南市实施 (随后又取消) 的一项「购买 90 平米以上住房即可获得城市户口」的特殊政策为切入点,采用 RDD 估算了「户口的市场价值」。从经济学的角度来讲,该文估算了个人的支付意愿「WTP」。
1.研究背景
户口制度是中国的户籍制度,它建立于 1958 年,目的是控制农村居民流入城市,使资本密集型重工业发展现代化。户口制度不仅是人口登记的方法,也是市政府授予各种专有权利的工具——其中最重要的是享有某些公共服务和福利的权利。这些服务主要包括儿童义务教育、地方考试报名、非工作人员社会保险补贴、城市最低生活津贴和可负担的住房福利。从寻求城市户口的个人的角度来看,户口价值可以衡量为个人的支付意愿(WTP)。许多研究估计了户口的供给(成本)方面。本文通过对中国户口发放需求面的探索,填补了一个重要的空白。
从国家一级户口条例的演变来看,自 20 世纪 90 年代后半期以来,户籍政策与购房有关。 自 21 世纪以来,随着中国房地产市场的快速发展,高房价的持续存在和资产泡沫的出现,促使地方政府结合自己的情况,对购房和抵押贷款实行了一些限制,放松了户籍与购房的关系。
在这种大背景下,作者重点关注了 2000 年以来济南户口管理系统购房政策的演变,基于济南的数据进行了实证分析。简要来说,2008 年 11 月,济南市政府下发通知,规定:
在城区,如果房主是购买一套建筑面积为 90 平方米以上(含)的 新房 并获得房产证,则可被授予城市户口;
如果房主是购买一套建筑面积 90 平方米以上(含)的 二手房 并持有房产证超过两年,也可被授予城市户口。
此后,该门槛建筑面积要求在 2017 年 8 月被济南市政府取消 (随后的入户条件里仍然要求在市内拥有住房,但不再限制房子的面积)。 因此,作者认为购房的建筑面积要求似乎是一个有价值但不常见的案例,可以借此研究在中国户口制度演进过程中户口的价值,以及在城市中享有公共服务和福利的基本权利。
2.研究设定
2.1 数据来源与描述
【政策取消是在2017年8月】我们使用2017年6月至2017年7月济南市的上市住房交易数据来实施RDD,并估算济南市城市户口的价值或户口的边际WTP。这些数据来自中国最大的二手房交易平台Fang.com。从该平台,我们收集了每栋待售房屋和房屋所在社区的许多特征。
我们还获得了同期的租金数据集。在我们考察的一个月里,住房市场、周边设施和相关公共政策几乎没有变化。因此,我们使用的数据集本质上可以被视为横断面。列出的住房交易数据集包含26031个观测值,经过修剪以消除可能的虚假异常值。经过类似的数据预处理后,租赁数据集包含11059个观测值。
学习点1:为什么样本时间是政策取消前俩月?
- 1.数据收集局限:实际下,二手交易平台,不会展示很长时间的房价交易数据。
- 2.政策下达,有一个预先性(信息差),在政策通知的前后一般响应比较明显。
学习点2:为什么是二手Fang.com交易平台?
- 需要说明这个平台数据的真实性,需要验证。
- 房子的销售,套路很多,销售数据可能存在虚假定价。Fang.com该平台比较靠谱,所以数据可信。
2.2 模型设定
- 控制组: 大于90的建筑面积
- 实验组: 大于90的建筑面积
3.结果和分析
3.1 描述性统计分析
- House price: 房价为每平方米单价
- Area:面积为房屋建筑面积
- Rooms:房间为房屋内的房间数
- Floor:楼层 = 1-3,分别为低、中、高楼层
- Decoration:装修 = 1-5,表示无装修、简易装修、中装修、精装修和豪华装修
- Elevator:电梯 = 1 或 2,表示建筑物内有无电梯
- FAR:表示建筑面积比 (套内面积/建筑面积)。
4.2 政策效果图示
执行如下命令即可初步展示政策效果:
rdplot price cut if abs(cut)<20, cut(0) p(2) // 不显示置信区间
rdplot price cut if abs(cut)<20, cut(0) p(2) binselect(es) ci(95)
- abs(cut)<20 : 正负20范围
- p(2):二阶
4.3 随机分配检验
随机分配检验(Randomization Test)是一种非参数统计方法,用于评估两组或多组数据之间的差异是否显著。这种方法的基本思想是通过重新组合或“随机分配”原始数据中的观测值到不同的组别中,来构建一个假设的分布,从而估计实际观察到的统计量在零假设下出现的概率。
随机分配检验的步骤:
-
- 提出假设:
零假设(H₀):两组数据之间没有差异。
备择假设(H₁):两组数据之间存在差异。
-
- 计算初始统计量:
根据你的研究问题选择一个合适的统计量,比如两组之间的均值差。
计算在原数据上的这个统计量。
-
- 数据的随机化:
将所有观测值合并成一个单一的数据池。
从这个数据池中随机抽取样本,这些样本的数量与原始组别相同,并将其标记为“组A”,剩余的标记为“组B”。
-
- 计算随机化统计量:
对于每一次随机抽样,重复步骤2的操作,计算出一个统计量值。
-
- 重复步骤3和4:
进行大量的随机抽样(例如1000次或更多),每次计算相应的统计量。
-
- 确定P值:
P值是随机化过程中得到的统计量值至少与实际观察到的统计量一样极端的概率。
如果P值小于某个显著性水平(如0.05),则拒绝零假设,认为两组数据之间存在显著差异。
例子
假设我们有两个班级的学生,A班和B班,我们想知道这两个班级的数学成绩是否有显著差异。A班有20名学生,B班也有20名学生。我们记录了每个学生的数学成绩。
- 原始数据:A班平均分为80分,B班平均分为85分,两班总平均分为82.5分。
- 提出零假设:两班数学成绩无显著差异。
- 初始统计量:A班和B班之间的均值差为-5分(80 - 85 = -5)。
- 数据随机化:将两个班级的成绩混合在一起,共40个分数,然后随机分成两个组,每组20人。
- 计算随机化统计量:对于每次随机划分,计算两组间的均值差。重复步骤3和4多次(如1000次),每次都计算两组间的均值差。
- 确定P值:看有多少次随机化后的均值差至少为-5或更极端(即+5或更大)。如果这样的次数占总次数的比例小于0.05,则认为两班成绩有显著差异。
「随机分配检验」的基本思想是:如果 分配变量 (running variable) 在 断点 (cutoff) 没有受到人为操控,则分配变量的观测值在断点两侧的概率密度 (density) 应该是连续的。如果检验发现非连续特征,则意味着个体并不是随机进入「实验组」和「控制组」组的,这可能源于自选择 (self-selection) 或人为干预 (Cattaneo, Jansson and Ma, 2018, pp.234)。
我们需要接受原假设,没有差异(没有操纵)
- 线似乎没有连续,但是在统计意义上的区间是高度重合的,所以不存在差异
基于stata的代码
rddensity
作者不同窗口的回归结果
- 窗口选择
- 不同窗口的结果
稳健性检验
-
线性交互
-
二次项
-
交互二次项
安慰剂检验
本文的安慰检验有两个
- 安慰剂检验1:虚构断点
作者使用了两个「虚构」的政策分配点,分别为 70和110平方米结果呈现于表 8。我们可以发现,表中所有 RD 处理效应均不显著。因此,本文确信了价格跳跃是来自于政策引起的可落户价值而不是房屋自身的物理性质。
如果70或者110也出现大约1000的差距,那么结论就有问题了
H
0
:
τ
=
0
H_0:\tau =0
H0:τ=0
- 安慰剂检验 2:采用租金数据
基本思想:租一套 90 平米的方式是无法获得学位的。