Stata:做数据格式转换时,“contains nonnumeric characters; no replace”警告

将数据从excel复制或导入stata中经常会遇到字体红色的情况,一般是因为数据非字符。运行destring,replace经常看到

“contains nonnumeric characters; no replace”警告

这种情况最好不要贸然运用destring加force等选项,这样可能带来数值扭曲。原本仅仅格式有问题的观测值可能被软件处理成缺失值等。

最稳妥的方法是,检验到底那些数据是nonnumeric以及其特征。

命令:tab var if regexm(var,"[^0-9.]")

最常见的是发现观测值中有空格如1 001,有奇怪符号如1?001,符号错误如"."被记录成了","。

这时候可以使用替换命令:replace var=subinstr(var,"待替换","替换",.)

然后运行destring,replace(或其他选项)

注意:0.1.22之类的观测值,往往不能被tab命令识别,这时候就要sort var,肉眼识别了。这种情况少见,一旦有,观测值也不会太多,在edit模式下手工更正即可。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值