基本设定
#基本命令
pwd #显示stata当前工作的路径
cd E:\stata14\stata #进入指定文件夹
sysdir #stata官方文件的路径
doedit E:\stata14\profile.do #每次启动时需要立刻执行的命令
输入和导入数据
1.输入数据三种方式:
- 手动输入
clear
input x y z
1 2 3
4 5 6
end
save mydata, replace //保存数据
use mydata, clear //调入数据
注:-clear-命令的使用
clear 删除变量
sysuse auto, clear //clear并不影响硬盘上存储的数据
- 从.txt,Excel表格中粘贴
基本要求:数据是以-Tab- 键分隔的
shellout d1.txt //可以直接copy-paste
shellout d1.xls
edit
- 使用Stata命令:infile, insheet, infix
以-tab-分隔的数据: -insheet-命令
type d1.txt //查看原始资料的形态
type d1.txt, showtabs
shellout d1.txt
insheet using d1.txt, clear
以 空格 分隔的数据: -infile-命令
调入STATA格式的数据: -use-命令
调入Excel格式的数据: -xmluse-命令
行列对调的数据
存储和导出数据
#定义工作路径
cd "E:\Data\CFPS\CFPS-2018"
#保存数据
save "cfps2018.dta",replace
#导出数据到Excel
export excel using "数据表.xlsx", sheet("Sheet1") firstrow(varlabels) replace //替换Excel文件
export excel using "数据表.xlsx", sheet("Sheet1",modify) firstrow(varlabels) //替换Sheet表格,firstrow(varlabels) 将变量标签作为表头
export excel using "数据表.xlsx", sheet("Sheet1",modify) firstrow(variables) //替换Sheet表格,firstrow(variables) 将变量名作为表头
基本操作
1.将str类型的数据转化为数值型
destring 变量名,replace force #直接替换原数据
destring 变量名,g(新变量名) #另外生成新的一列
2.删除或增加变量
#删除变量
drop x1 x2
#删除所有变量均为缺失值的行(亲测有效版)
egen missing_indicator=rowmiss(_all)
drop if missing_indicator
drop missing_indicator
3.将运行结果导出到word中
outreg2 using 描述性统计结果.doc,replace sum(log)
描述性统计分析
describe
summarize
#查看某个变量
codebook 变量名
#查看所有变量
codebook
变量处理
#一、生成虚拟变量
'''方式一:get和replace'''
get x_1=1 if Distric=="碑林区" | Distric=="新城区" | Distric=="莲湖区"
replace x_1=0 if x_1==.
'''方式二:tab'''
tab 变量名,gen(var_) #var为新变量前缀,可替换
#二、对变量进行归一化
ssc install norm, replace //安装norm命令
norm 变量名,method(mmx)