谁是卧底 python_xpose和sxpose,谁是卧底?

本文作者:崔赵雯,中南财经政法大学经济学院

文字编辑:王玉婷

技术总编:余术玲

一、导论

在Stata中进行数据处理时,我们可能会进行数据转置的操作,对数据转置的命令有xpose和sxpose,今天就为大家介绍一下这两个命令之间的区别。往下看吧!

二、xpose命令

对数值型数据 进行转置,我们用的是xpose。它的作用是变量与观测值之间的相互转换。所有由转置过程中创建的新变量,存储类型是默认的,因此,当原始变量是字符串时,在转置后观测值中将包含缺失值。同时,如果将字符串数据转置两次,则会丢失字符串变量的内容。

xpose命令的语法结构如下:

其中[options]选项有:

①clear:这个选项是必须的,它是提醒你转置之后的原始数据将不存在;

②format:将原始数据中的最大数字显示格式应用于转置后的数据中;

③format(%fmt) :按照设定的数字显示格式应用于转置数据中;

④varname:在转置后的数据中保留原始数据的变量名称;

⑤promote:使转置后的数据存储类型为原始数据中精度最高的存储类型,以确保数值的精确度。当运算精度要求很高的时候,需要将变量的存储类型设置成浮点型或双精度型,但是转置后的数据可能会改变数据的存储类型,这时候我们可以[promote]选项,保证转置后的数值精度。如果原始数据中有变量的存储类型是double,那么转置后的所有数值的存储类型都是double。

下面我们对这些选项举几个例子:

关于varname选项的小例子:

clear all input hhid father mother //创建一个记录家庭成员收入的数据 1 4000 5000 2 6000 2500 3 8000 8000 end //注意input命令要和end命令一起执行 list

对数据进行转置:

xpose,clear varname list

如果我们不指定varname选项,变量不会创建_varname,即观测值是原始数据的变量名称。但是,我们想要把第一次转置后的数据再次转置为原始形式,varname选项是要有的。

xpose,clear list

关于format(%fmt)选项的小例子:

clear all input id str10 name economy //录入学生学号、姓名和成绩的数据。注意:因为name是字符串类型的数据,因此name前需要加上表示字符串类型的str#,其中#是代表字节长度的数字 1 John 40 2 Chris 80.5 3 Jack 90 4 Tom 53.5 end list

对数据进行转置,并通过format(%fmt)选项来设定数字显示格式。

xpose,clear varname format(%10.2f) list

从运行结果可以看出变量v1-v4观测值均保留两位有效数字。同时,从这个例子中,我们也可以看到xpose不能对字符型数据进行转置,转置后的字符型数据显示为缺失值。

关于promote选项的小例子:

clear all sysuse sp500 keep in 1/5 describe

可以看到数值型变量的数据类型有int、float和double,不难发现,原始数据中最高精度的数据存储类型为double。如果转置时不使用promote选项,转置后的数据存储类型变成了float,这就降低了数据的精确度。

xpose,clear describe

如果转置时使用promote选项,数据的存储类型都变成了double,确保了转置后数据的精确度。

clear all sysuse sp500 keep in 1/5 xpose,clear promote describe

三、sxpose命令

对字符型数据进行转置,我们用的是sxpose,实现变量与观测值之间的相互转换。

sxpose是一个外部命令,初次使用需要安装,安装命令为:

ssc install sxpose

安装成功显示完成信息:

sxpose命令的语法结构如下:

其中,其[中[options]选项有:

①clear:这个选项是必须的,与xpose的clear选项作用相同;

②force:当遇到数值型数据时,继续进行转置,并把数值型数据强制转化为字符型数据;

③format():将设定的格式应用于显示为数值的字符型数据中;

④firstnames:将原始数据的第一列设置为转置后数据的变量名称;

⑤destring:将字符型数据转换为数值型数据。

我们对这些选项举几个例子;

关于force选项的小例子:

clear all webuse census10,clear //美国人口普查数据 keep in 1/5 sxpose,clear list

如果没有force选项,系统会报错,这是因为pop和medage为数值型数据,且region为带有数值标签的数据,在sxpose后加上force选项,会将这些数据强制转化为字符型数据。

sxpose,clear force list

关于firstnames选项的小例子:

clear all webuse census10,clear //美国人口普查数据 keep in 1/5 list

使用firstnames选项后,原始数据的第一列就不会出现在转置后的观测值中了,原始数据的第一列成为转置后数据的变量名称。

sxpose,clear force firstnames list

关于destring选项的小例子:

clear all webuse census10,clear //美国人口普查数据 drop state keep in 1/5 sxpose,clear force describe

可以看到,未使用destring选项时,数据类型为字符型,使用destring选项后,数据类型变为了数值型。

clear all webuse census10,clear //美国人口普查数据 drop state keep in 1/5 sxpose,clear force destring describe

以上就是今天的全部内容啦,如果对你有帮助的话,别忘了点个赞呀,加个关注咯,转载、打赏都可以呦~

关注Stata and Python数据分析,获取更多干货~

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
本系统的研发具有重大的意义,在安全性方面,用户使用浏览器访问网站时,采用注册和密码等相关的保护措施,提高系统的可靠性,维护用户的个人信息和财产的安全。在方便性方面,促进了校园失物招领网站的信息化建设,极大的方便了相关的工作人员对校园失物招领网站信息进行管理。 本系统主要通过使用Java语言编码设计系统功能,MySQL数据库管理数据,AJAX技术设计简洁的、友好的网址页面,然后在IDEA开发平台中,编写相关的Java代码文件,接着通过连接语言完成与数据库的搭建工作,再通过平台提供的Tomcat插件完成信息的交互,最后在浏览器中打开系统网址便可使用本系统。本系统的使用角色可以被分为用户和管理员,用户具有注册、查看信息、留言信息等功能,管理员具有修改用户信息,发布寻物启事等功能。 管理员可以选择任一浏览器打开网址,输入信息无误后,以管理员的身份行使相关的管理权限。管理员可以通过选择失物招领管理,管理相关的失物招领信息记录,比如进行查看失物招领信息标题,修改失物招领信息来源等操作。管理员可以通过选择公告管理,管理相关的公告信息记录,比如进行查看公告详情,删除错误的公告信息,发布公告等操作。管理员可以通过选择公告类型管理,管理相关的公告类型信息,比如查看所有公告类型,删除无用公告类型,修改公告类型,添加公告类型等操作。寻物启事管理页面,此页面提供给管理员的功能有:新增寻物启事,修改寻物启事,删除寻物启事。物品类型管理页面,此页面提供给管理员的功能有:新增物品类型,修改物品类型,删除物品类型。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值