本节书摘来自异步社区《社会调查数据管理——基于Stata 14管理CGSS数据》一书中的第3章,第3.4节,作者 唐丽娜,更多章节内容可以访问云栖社区“异步社区”公众号查看
3.4 Stata的一些术语及使用通则
在讲解Stata术语及使用通则之前,首先了解一下Stata。简言之,Stata是一个统计软件,可用于统计分析和数据管理。Stata是付费软件,用户可以从Stata的官网上直接购买最新版的Stata 14。
安装Stata后,打开Stata,界面如图3-1所示。
Stata的主界面由六部分构成:工具栏、命令回顾窗口(Review)、结果窗口(Result)、命令窗口(Command)、变量窗口(Variables)和属性窗口(Properties)。
中间最大一部分是结果窗口,所有命令运行出的结果都显示在这个窗口里。最上边是工具栏,用户可以通过单击图标操作Stata,本书不建议用“单击”菜单的方法来分析数据和管理数据,而是通过Stata的do-file(详见3.4.1)来完成数据分析和数据管理工作。结果窗口的下面就是命令窗口,用户直接在此输入命令,按回车键(Enter键)即可运行。
结果窗口的左边是命令回顾窗口,打开Stata后,运行的所有命令都被保存在回顾窗口,如果用户想再次使用已经用过的命令,既可以在命令窗口重新输入一遍,也可以直接单击回顾窗口的命令,此时该命令就会直接出现在命令窗口。

结果窗口的右上方是变量窗口,数据里的所有变量都会在此显示。右下方是属性窗口,该窗口有两个子窗口:变量(Variables)窗口和窗口(Data)数据。
在主窗口的左下方显示的是当前工作目录(current working directory)。
和以前的版本相比,Stata14新增了很多功能,如命令unicode,该命令能轻松解决不同语言之间的编码转换问题。在Stata14以前的版本中,经常会遇到汉字乱码问题,Stata14的unicode命令专门解决这类问题。
3.4.1 Stata中的常用术语
和其他程序一样,Stata里有一些常见的术语,理解这些术语的含义是学好Stata的基础,也是做好数据管理工作的基础。对于那些用过Stata的用户,下面要讲的这些概念多数都听说过,甚至都用过,但不见得真正理解了这些概念的全部。数据管理者在常规的数据管理工作中肯定会常常用到下面这些术语,因此强烈建议读者抽出一定的时间来消化吸收它们。
命令:就是让Stata做事情的指示,不同的命令让Stata做不同的数据分析或数据管理工作。例如:命令describe让Stata做描述分析,命令tabulate让Stata做频数分布表。
do-file:do文件就是Stata自带的文本编辑器,有一个独立的窗口,是包含命令语句的文本文件。用户可以把数据分析和数据管理用到的所有命令和注释都写在do文件里,并保存成一个后缀为.do的文件。例如:把讲解do-file的所有命令和注释都保存在文件doexample.do里,如图3-2所示。

要想运行这个do文件,可以单击上面工具栏中的运行图标(如图3-2所示)——Execute(do),或者单击control+d,运行结果是:
. log using doexample, text replace //[4]建立一个名为doexample的log文件
------------------------------------------------------------
name: < unnamed>
log: C:\Users\leana\Desktop\ssdm\doexample.log
log type: text
opened on: 10 Jan 2016, 15:25:38
. ******这个do文件是用来讲解do文件的示例******[5]
. set more off
. use cgss2013, clear //打开数据cgss2013
. tabulate a15 a2 //做性别和健康的交互表
您觉得您目 |
前的身体健 | 性别
康状况是 | 男 女 | Total
--------------+-----------------------+----------
拒绝回答 | 1 1 | 2
很不健康 | 156 178 | 334
比较不健康 | 703 831 | 1,534
一般 | 1,070 1,155 | 2,225
比较健康 | 2,193 2,156 | 4,349
很健康 | 1,633 1,361 | 2,994
---------------+-----------------------+----------
Total | 5,756 5,682 | 11,438
. log close //退出log
name: < unnamed>
log: C:\Users\leana\Desktop\ssdm\doexample.log
log type: text
closed on: 10 Jan 2016, 15:25:38
------------------------------------------------------------
. exit //退出Stata
end of do-file
do文件就是一个用来记录命令的笔记本。通过交互模式中命令窗口输入的命令,都会暂时被保留在命令回顾(Review)窗口里,但只要关闭Stata,这些命令就会消失,用do文件可以把它们以文件的形式保存下来,不会因为关闭Stata就没有了。
打开do文件有两种途径:第一种途径是直接单击工具栏上的do文件编辑器图标(如图3-3所示);第二种途径是在命令窗口输入命令doedit,打开一个新的do文件,如果已经知道do文件的名字,如cgss13datacleaning,用命令doedit cgss13datacleaning可直接打开这个指定的do文件。

CGSS的管理工作中有99%都在do文件里实现,书中所有的数据管理也都用do文件完成,在数据分析和数据管理中不建议直接在命令窗口输入命令,这样一旦发现前面的某个命令输错了,需要把所有的命令都重新输入一遍。如果用do文件,可以找到错误命令把它改正过来,然后重新运行一次即可。而且&#x