散点图是常用的表现两个变量或多个变量之间相关关系的统计图。它用点的密集程度和趋势来表示变量之间的相关关系。
对于回归分析来说,借助散点图可以预先判断变量之间的线性关系是否适合做线性回归,但是由于观测变量的不确定性,其散点的变化趋势往往是不规则的,特别是异常值的出现,会大大影响回归结果。
此时带置信区间的散点图,不仅可以帮你判断散点趋势还能判断异常值的情况,其绘制步骤与命令如下:
sysuse auto, clear
quietly regress mpg weight
predict hat
predict stf, stdf
gen lo = hat - 1.96*stf
gen hi = hat + 1.96*stf
scatter mpg weight || line hat lo hi weight, pstyle(p2 p3 p3) sort
得到的图形为:
下面对命令行进行解释:
sysuse auto, clear
自动导入stata自带的数据
quietly regress mpg weight
快速进行线性回归
predict hat
生成因变量的预测值yhat 序列
predict stf, stdf
生成预测值的yhat 的标准误(S.E. of the forecast)序列
gen lo = hat - 1.96*stf
生成预测值的yhat 置信上限序列(95%的显著性水平下,1.96就是Z值)
gen hi = hat + 1.96*stf
生成预测值的yhat 置信下限序列(95%的显著性水平下,1.96就是Z值)
scatter mpg weight || line hat lo hi weight, pstyle(p2 p3 p3) sort
做出散点和折线的复合图(||是并且的意思),pstyle是对图形的一些调整,可用可不用