来源:Taotao Tu原创。
数据:《应用stata做统计分析》
大家好!今天给大家讲一讲如何使用stata软件中的graph box来识别异常点。
那么,什么是异常点呢? 异常点指的是和其它样本差别很大的点,这些异常点的出现往往意味着特殊情况的发生,通常会对我们的统计分析产生很大影响。因此,如何有效识别异常点成为了统计分析中的重要基础性工作。
1.今天我们使用 《应用stata做统计分析》中的nations.dta数据进行例子讲解
首先,还是让我们看看数据文件包含哪些变量吧。
describe
2.异常值的初步甄别
那么,这些数据中,到底哪些可能会出现异常值呢? 让我用graph box图形来看一看。
graph box pop birth death chldmort infmort life food energy gnpcap gnpgro urban school1 school2 school3