本文作者:王子一,中南财经政法大学金融学院
文字编辑:崔赵雯
技术总编:余术玲
有些时候大家从网页或者其他途径拿到的数据,作者为了展示数据的美观,通常会采用宽数据格式进行展示,那么什么叫做宽数据呢?pick一个小知识点:
宽数据是相对于长数据而言的,长数据是指没有对数据集中的变量做细分,即变量中至少有一个变量中的元素值存在重复循环的情况,表格整体的形状为长方形,变量少而观察值多的数据形式,如下图:
图9.png
那么宽数据则是指对数据集中所有的变量进行了细分,各变量的值不存在重复循环的情况,数据集表现形式为变量多而观察值少的情况,以下图展示为例:
图10.png
一般情况下,如果当我们拿到这种宽数据,并且需要对其进行转化使用分析时,小白同学通常就会选择用Excel进行手动操作,剪切粘贴剪贴粘贴...披星戴月...将多列数据归到一列中去,结果一眨眼!!你记不清处理到了哪里,两手抓虾只能重新来过。这时,Stata出现了一个简单的命令,简简单单的操作会给你带来极大的便利,它就是stack命令,一个可以完全取代Excel手动操作的数据重整命令,下面