1、回归分析示例
已知模型如下:
mpg=beta_0 + beta_1 weight + beta_2 weight^2 + beta_3 foreign + e
现在要根据上述模型在stata当中进行回归操作
(1)导入stata自带的一份数据
sysuse auto,clear
(2)生成新变量
generate weight_2 = weight ^ 2
(3)回归
regress mpg weight weight_2 foreign
解释:
weight (车辆重量):系数为-0.0165729,表示在其他变量不变的情况下,车辆重量每增加1单位,mpg(每加仑行驶英里数)减少约0.0166。p值为0.000,表示这个系数在统计上显著。
weight_2 (车辆重量的平方项):系数为1.59e-06,表示在其他变量不变的情况下,车辆重量平方项每增加1单位,mpg增加约1.59e-06。p值为0.013,表示这个系数在统计上显著。
foreign (是否是进口车):系数为-2.2035,表示在其他变量不变的情况下,进口车的mpg比非进口车低约2.2035。p值为0.041,表示这个系数在统计上显著。
常数项 (_cons):系数为56.53884,表示当所有解释变量为0时的mpg值。p值为0.000,表示这个系数在统计上显著。
模型表明:
车辆重量对mpg有负面影响,但这种影响是非线性的(包含了平方项)。
进口车的燃油效率(mpg)普遍低于非进口车。
模型整体在统计上显著,并且能够解释mpg变异的69.13%。
(4)生成mpg的拟合值
predict mpg_hat
(5)生成残差
predict u,resid
(6)绘制原始数据的散点图
. sort weight
. twoway (scatter mpg weight) (line mpg_hat weight) , by(foreign)
2、数据列示和基本命令语法
(1)查看帮助文档
以list为例
help list
查看帮助文档
1、中括号 [ ] 里面的内容是可选的,可填可不填。
list
list make price
(2)简写
l make
(3)通配符
list m*
list price-weight
(4)条件判断
list price if price < 4000
查看price小于4000的数据
(5)运算
注意值标签,虽然是文字,但是是用值表示的。此外,判断相等要用两个等于号!
输出前20行,in表明的是范围
3、生成新变量
sysuse auto,clear
keep make price mpg rep78
保留其中的4个变量
generate rep78_ =rep78 ^2
keep是保留数据
keep rep78
keep 1/20
drop是删除数据
4、画图
twoway
可以简写成tw
twoway (scatter price weight) (qfit price weight) , title("拟合图片")