- 博客(1)
- 收藏
- 关注
原创 【stata笔记】从规律混乱的字符串中提取某个类别的字符(以CGSS2010的地区变量为例)
问题 使用CGSS2010重复某文章中的定量研究,中需要因变量“区县人均收入”。如何在CGSS2010中为所有样本生成一个格式一的“所在区县”信息? CGSS2010中包含区县信息的变量为S42。tab s42 发现,其中填写方式混乱,在是否包含市级信息,是否包含“市”、“区”、县”等字样、是否包含空格等方面存在大量不一致,无法采用统一的标记及顺序行提取。目标 尽量避免缺失值地生成区县变量,内容为不包含地区行政级别的区县名称,一 般是2个字,也可能是1或3个字。分析过程使用tab查看当
2020-12-13 21:57:36
7405
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人