本文作者:孙晓玲
文字编辑:李钊颖
技术总编:李朋冲
作为一个数据处理和分析软件,Stata的强大功能使得我们的研究和学习效率大大提升。在很多时候,我们需要处理庞大的数据集,它们可能有着成百上千个变量,且许多都以英文简写来表示。在使用过程中,我们可能会混淆变量的含义,如果我们同时在处理几个数据,甚至连“混淆”都不可得了——只留下遗忘... 为解决这一问题,Stata提供了一个便捷的命令——label。顾名思义,label命令允许我们进行“贴标签”的操作,其对象包括数据集、变量和数值三种类型。在介绍该命令之前,我们调用Stata自带的auto数据集,查看其数据信息。程序和结果如下:sysuse auto, cleardescribe
上图右上角显示“1978 Automobile Data”,可知这是1978年的汽车数据;表格最后一列“variable label”表示变量标签,解释了各个变量的含义;倒数第二列“value label”为值标签,显示对变量“foreign”的取值添加了标签。 那么,这些标签是如何添加的呢?我们通过一个案例,为大家一一 “揭秘”。首先使用input命令,输入某个班级学生的考试信息,包括他们的学号、姓名、性别、民族及各科成绩。程序如下:
clearinput id str20 name gender nationality English Math Chinese1 "李华" 0 1 77 90 882 "阿塔丽" 1 2 82 76 753 "张丽" 1 1 89 88 794 "古拉马" 0 2 73 84 855 "张伟" 0 1 79 75 916 "布兰克" 0 3 99 84 74end
在此基础上,我们分别介绍数据集标签、变量标签和值标签的添加。
1.数据集标签
对当前数据集贴标签,可将数据集命名为特定名称。其基本语法如下:
<