微信公众号:学点啥玩点啥
和你一起学习一起玩耍小白友好型
stata如何去掉中文字符串中的英文
关于中文字符串中包含英文的情况,这在整理统计年鉴的数据时经常发生,我们往往会发现各省市的中文名后面紧跟一个英文名,这对我们的数据分析和模型构建会起到很大的阻碍作用。
![0fcdc0ebef663feca8a98a8c428b7ee9.png](https://i-blog.csdnimg.cn/blog_migrate/715e9ad8a73761f2c68bb505a42d9dd7.png)
那么如何去掉这些中文字符串中的英文字母呢?显然一般的
substr
函数是不行的,因为每个字符串的长短不一样,英文出现的位置也不一样,当然正则表达式是可以解决的,今天暂时不这样做,今天所采用的方法是
循环+
subinstr
。
直接看代码
capture program drop dropeng
program define dropeng
version 16.0
args var
qui forvalues i = 65(1)90{