stata基本处理
首先是非常多的csv文件 3g多的数据 如何合并为一个
win+r cmd d: +cd+路径 随后 copy*.csv all.csv 就可以啦
- stata str转number help destring
- 我发现 destring ,replace 可以全部变量都换成long…
分类变量 如何放入回归?
1)通过 code tripType 显示此变量的类型,如下
tripType
type: string (str8)
tabulation: Freq. Value
output:2,164 “BUSINESS”
3,519 “COUPLES”
encode tripType, gen (newtripType)
然后将新的变量进行reg 就可以有结果惹,记得要加i.变量
renvars wage race, postfix(_new) // 批量增加后缀
生成虚拟变量
变量分类少的
tab race, gen(dum_race)
多的
字符串分割 gen isic3=substr(isic3_four,1,3)
排序分组
sort wage // 变量排序【注意】
gen g_wage = group(5) // 变量分组
tab g_wage