开一文记录和总结stata的学习,不断更新中~
拿到一个数据集,首先要全局了解一下这个数据集的情况:
【describe】查看这个数据集的简要介绍,包括了样本数量(obs:)、变量数量(vars:)、大小(size:)、以及每个标量的简要介绍。
【describe[varlist]】:可以单独选择某个变量查看,[]表示可选。
【describe,short】:只看整个数据集的总体概况,即截图显示的上半部分。
【count】:number of rows
【count if missing() 】:设置条件
【isid()】:check if an variable uniquely id entifies the data.检查变量是否唯一标识数据,相当于判断主属性。
【unique】先安装,指令【ssc install unique】
重复值数据量(所有数据量)和唯一值(不重复的数据)数据量。
【codebook】:适合初次接触一个数据集时查看一些信息
类型(numeric: )、标签(label)、范围(range)、单位(units)、特异值&#