(五)数据清理之stata的使用----------变量进行具体处理的命令(转载)

br:浏览文件所存储的内容
set obs n(具体样本数量):该命令会自动帮你生成n个样本
list :显示样本的内容,使用方法为:
list in 5//显示第5个样本的内容
list in 1/10 // "/"表示至的关系,显示1到至10的样本内容
list var1 var2 in 1/5 //仅显示var1 var2 这两个变量1至5个样本的内容

describe(des):对变量的具体信息进行描述,使用方法为:
des //默认对文件中所有变量的信息进行显示
des var1 var2//对var1 var2 的信息进行显示

gen:生成变量使用,生成字符型命令为:gen var="",生成数值型为:gen var=.
egen:该命令也是生成变量使用,与gen不同的是该命令是通过计算函数得出来的变量,比如:mean、sum、max等等,具体实用方法为:

egen=func(var)//func指的是函数名称

destring:有时候在你导入文件时会发现原本为数值型的变量导入之后变为了字符型变量,而当变量为字符型时是无法进行回归检验的,此时就需要将该变量转化为数值型,具体使用方法为:
des var1 //如果为str表示字符型,为int/float表示数值型
destring var1,gen (var2)//将字符型变量var1转变为数值型变量var2,此时var1仍为字符型变量
destring var1,replace //将字符型变量var1转变为数值型变量var1
destring var1,force replace //将字符型变量var1强制转变为数值型变量var1,此命令适用于该变量本身就存在字符,但仍然想将其转化为数值型,转化后原本含有字符的样本会变成缺失值(.),如果不加force当变量本身就存在字符时该命令不会执行
tostring:该命令是与destring相对应的一个命令,但使用的相对较少,此时就需要将该变量转化为字符型,具体使用方法为:
tostring var1,gen(var2)
tostring var1,force replace

encode:这个命令是将本来就是字符型的变量转化为数字,但它与destring的用法不同,encode使用的主要为一些分类变量,比如我们在进行面板回归时,需要将字符型的城市转为会数字才能进行回归,但此时你使用br进行浏览时,你会发现单元格放的仍然是城市,只不过颜色已经有红色变为蓝色,点击其中的单元格会发现该单元格实际存贮的数字,外在表现是城市。具体使用方法为:
encode city,gen (city0)

reshape:该命令用来进行长宽格式变化,之所以进行格式的调换是由于我们有时候下载的数据会是下图显示的宽格式,而我们在实际回归中往往需要的是长格式的数据,此时就需要对格式进行调换。具体使用命令为:
reshape long gdp,i(city),j(year)//命令行的解释见下面两个表
city gdp2010 gdp2011 gdp2012 gdp2013
beijing … … … …
shanghai … … … …
guangzhou … … … …
shenzhen … … … …
year city gdp
2010 beijing …
2011 beijing …
2012 beijing …
2013 bejing …
2010 shanghai …
2011 shanghai …
2012 shanghai …
2013 shanghai …

11._n:每一行数据都有一个_n,指的就是数据的行数,主要使用方法为:

gen id=_n //生成一个变量id,该变量放的为样本的序列号为:1,2,3,4…
12._N:是指整个数据集中有多少数据,主要使用方法为:

gen count=_N //生成变量count,该变量为样本的总数

原文链接:https://blog.csdn.net/qq_42729246/article/details/105705264

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值