导入数据
打开stata,文件功能下有导入按钮,可以按照导入的文件选择。
数据的处理
点击变量窗口中的变量,然后在修改数据的标签,在属性窗口。
粗略查看数据集
. describe 或者 . d
举例:
查看具体数据
. list 变量名
. list 变量名 if 变量的条件
. list 变量名 in 3/9 / 表示为 至 , 第3至9个记录
举例:
逻辑运算符
== 等于
> 大于
< 小于
>= 大于等于
<= 小于等于
~= 不等于
数据筛选
. drop 为删除数据
.keep 为保留数据
举例:
查看统计信息
. summarize 变量名
. summarize 变量名 if 条件查看
. su 变量名
. su 变量名 if 条件查看
. su 变量名,detail 详细统计数据
经验积累分布函数
. tabulate 变量名
计算相关系数
. pwcorr 变量名...,sig star(0.05)
sig是显示P值,star是加上显著性*
举例,显著的概率值取得比较大,为了显示 * :
画图
. histogram Q,width(100) frequency width(条形图的宽度)
. kdensity 变量名
连续的核密度曲线
. scatter Q TC
生成点的标签
gen n = _n 生成数据的标签
scatter TC Q ,mlabels(n) mlabpos(6) 六点钟方向
散点图同时画出回归直线:
保存图片
graph save graph1
汇总图片
graph combine scatter1.gph scatter2.gph 合成一张图片
计算功能
display 公式
回归拟合
fit
reg
lfit
qfit 二次项
vce 计算协方差矩阵
noconstant 回归不加入常数项
predict 保存的变量名 输出拟合值
predict e1,residual 输出残差,保存为e1
假设检验
线性检验
test 变量名=1 假设检验
test (变量名=1)(变量名+变量名+变量名 = 1) 都是假设检验中的原假设
非线性检验
test _b[Q]=_b[TC]^2 操作未成功,还未解决。求解???????????????????????
变量的残差图
avplots
约束回归
constraint def 1 PL + PK + PF = 1
constraint def 2 Q = 1
cnsreg TC PL PK PF Q ,c(1,2) 调用第1,2个条件
例子: