Stata一般识别的数据文件的后缀名为.dta,打开这些数据文件的命令为use命令,首先讲解一下use命令的基本语句,具体格式如下:
use [varlist] [if] [in] using filename [, clear nolabel]
这个命令中,use是打开数据的命令语句,varlist代表变量名称,if是条件语句,in是范围语句,using
filename代表数据文件路径。
use "C:\data\test.dta"
use 变量1 变量2 using "C:\data\test.dta"
#部分变量
use "C:\data\test.dta" in 5\10 #部分样本
use "C:\data\test.dta" if foreign==1#某些特征的样本
net from http://www.stata-press.com/data/dsemus/ #打开网络数据
net describe dsemus
net get dsemus
一、Stata常用数据类型、压缩、转化
1、Stata常用的数据类型主要有三类:即数值型、字符型和日期型
2、compress命令能在很大程度上减少数据占用的存储空间,但不会改变数据的内容和精度,从而使用起来较为方便。数据压缩的命令语句为:
compress [varlist]
在这个命令语句中compress是进行数据压缩的命令语句,varlist是将要压缩的变量的名称,若不指明将要压缩的变量名称,Stata默认将对整个数据文件进行相应的压缩。
eg:
. clear #clear命令进行了内存的清空
. set obs 1 #是指样本容量设置为1
obs was 0, now 1
. gen a=1 #指生成一个变量名称为a,它的值为1
. describe
#describe命令用来描述变量的基本情况,可以看到这时候a的类型确实为float,这时为了压缩变量a所占用的存储空间
Contains data
obs: 1
vars: 1
size: 4
-------------------------------------------------------------------------------
storage display
value
variable name type format label variable label
-------------------------------------------------------------------------------
a float %9.0g
-------------------------------------------------------------------------------
. compress #
a was float now byte
(3 bytes saved)
. describe
Contains data
obs: 1
vars: 1
size: 1
-------------------------------------------------------------------------------
storage display
value
variable name type format label variable label
-------------------------------------------------------------------------------
a byte %9.0g
-------------------------------------------------------------------------------
可以发现这时a的