本节书摘来自华章出版社《Stata统计分析与应用(第2版)》一书中的第2章,第2.1节,作者 周广肃,更多章节内容可以访问云栖社区“华章计算机”公众号查看
2.1 数据的类型、压缩和转化
数据是进行实证研究的基础,也是运用Stata进行分析的基石,所以本节主要讲解最基本的数据打开、Stata中的数据类型,以及数据压缩与转化等相关操作内容。
2.1.1 数据的打开
Stata一般能够识别的数据文件的后缀名为.dta,打开这些数据文件的命令为use。use命令的基本语句格式如下:
use [varlist] [if] [in] using filename [, clear nolabel]
在这个命令中,use是打开数据的命令语句,varlist代表变量名称,if是条件语句,in是范围语句,using filename代表数据文件路径。
下面将详细介绍常用的5种情形,所使用到的数据文件名称为usaauto.dta,是根据统计资料得到的美国汽车产业的横截面数据(1978年)。在本书附带光盘的data文件夹中可以找到本章的流工作文件,表2.1显示了其中部分数据。
- 打开数据文件中的全部数据
如果想要打开usaauto数据文件中的全部数据,输入的标准命令如下:
use "C:datausaauto.dta"
use表示执行打开操作,引号中的C:datausaauto.dta表示数据文件的路径。这里的usaauto.dta文件放在了C盘data文件夹下。如果数据文件位于Stata默认的data文件夹中,则可使用如下简化命令:
use usaauto
此外还可以使用sysuse命令打开所有本地电脑上的数据文件,不管其是否在data文件夹中,而且不需要注明文件路径。在这个例子中命令如下:
sysuse usaauto
打开数据文件以后,会显示如图2.1所示的结果,Variables窗口将显示所有的变量名称及存储类型等内容。
- 打开数据文件中的部分变量
有时,并不需要将数据文件中的所有变量全部打开,因为原始数据可能内容丰