10.6生育行为如何影响劳动力供给?具体来说,如果妇女多生一位小孩,其劳动力供给将下降多少?本题使用来自美国1980年人口普查的数据集fertility_small.dta进行估计。此数据集包含美国21~35岁已婚且有两个或更多子女的妇女信息,主要变量为weeks(1979年的工作周数),morekids(是否有两个以上小孩),以及samesex(头两个小孩是否性别相同)。
(1)把weeks对虚拟变量morekids进行回归。有两个以上小孩的妇女是否比有两个小孩的妇女工作更少?少多少?此效应是否在统计上显著?
(2)上面(1)的回归能否估计生育行为对劳动力供给的因果效应?为什么?
(3)把morekids对samesex进行回归。如果头两个小孩性别相同,是否更可能生第三个小孩?此效应大吗?是否在统计上显著?
(4)在weeks对morekids的回归中,能否将samesex作为有效工具变量?为什么?
(5)samesex是否为弱工具变量?
(6)以samesex为工具变量,把weeks对morekids进行回归。生育行为对劳动力供给的效应有多大?是否在统计上显著?
解答如下:
在Stata中导入数据集fertility_small.dta,在命令窗口输入如下命令:
reg weeks morekids
pwcorr weeks morekids,sig
reg morekids samesex
pwcorr samesex morekids,sig
reg weeks morekids,r
ivregress 2sls weeks (morekids=samesex),r first
quietly ivregress 2sls weeks (morekids=samesex)
estat firststage
结果如下:
weeks对morekids回归结果如下:
(1)有两个以上小孩的妇女比两个小孩的妇女工作更少,少6.008217周,morekids在统计上高度显著(p值=0.000),但是该回归模型对被解释变量的变动情况的解释力太低,=0.0176,所以其拟合效果并不好,可信度不高。
weeks、morekids相关性检验结果如下:
(2)ols回归本身就是解释因果效应的一种手段,又由相关性检验结果知,weeks与morekids相关系数为0.0000,说明weeks与morekids相互独立,可以知道工作周数的大小与是否生两个以上小孩是独立的,独立性假设成立,则可以用回归系数来解释因果效应,即(1)的回归可以估计生育行为对劳动力供给的因果效应。
morekids对samesex回归结果如下:
(3)由回归结果知,如果头两个小孩性别相同,更可能生第三个小孩,此效应大,且samesex在统计上高度显著,p值为0.000,但是其回归模型的解释情况仍不理想,不能单纯的认为头两个小孩性别相同导致其生育第三个小孩。
samesex与内生解释变量morekids相关性检验结果如下:
(4)samesex与morekids相关系数为0.0689 ,二者存在微弱的相关性,由于samesex作为工具变量,工具变量个数等于内生解释变量个数,恰好识别,无法进行过度识别检验(在恰好识别的情况下,目前公认无法检验工具变量的外生性,即工具变量与扰动项不相关,在这种情况下,只能进行定性讨论或依赖专家的意见),定性讨论:由于samesex只能通过morekids来影响weeks,即samesex=1——>morekids=1——>weeks减少,所以认为工具变量samesex外生,综上可以将samesex作为有效工具变量。
判断samesex是否为弱工具变量检验结果如下:
(5)由于检验第一阶段回归的工具变量samesex系数显著性的F统计量为143.15>10,故认为samesex不是弱工具变量。
以samesex为工具变量,把weeks对morekids进行回归结果如下:
(6)由上表显示生育行为对劳动力供给的效应为-6.033194,且其在统计上并不显著。