stata15中文乱码_如何解决 Stata 14 的中文乱码问题？

最新推荐文章于 2023-04-17 09:39:21 发布

罗世凯

最新推荐文章于 2023-04-17 09:39:21 发布

阅读量1.6k

点赞数 2

文章标签： stata15中文乱码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_36424234/article/details/112925528

版权

不久前遇到一位朋友，诉说使用 Stata 14 出现中文乱码，而不得不退而使用更低版本的 Stata 的烦恼。其实，这只是因为 Stata 14 使用了 Unicode(统一码、万国码)。

何为 Unicode？根据百度百科的解释，“Unicode 是计算机科学领域里的一项业界标准，包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求”。

简而言之，Unicode 使得跨语言交流变得更为方便精准。但这也意味着，Stata 14 引入 Unicode 之后，在 Stata 文件中(dta，do，ado 文件等)，使用中文输入的字符就会出现乱码。解决方法也不难，只要进行适当的编码翻译(unicode translate)即可，即使用 Stata 14 提供的 unicode 系列命令，将中国大陆通行的国标码(GB18030)翻译为统一码。

正好手头有个关于中国姓氏人口的数据集出现了中文乱码，故截取部分变量的前10个观测值作为演示例子。首先，打开此数据集 surname_test.dta。

. use surname_test.dta, clear

点击数据编辑器 “Data Editor (Browse)” 的快捷键，查看数据：

可以看出，上表的最后一列，变量 character(中文姓氏)出现了乱码，无法正确显示。在使用 Stata 14 命令 unicode 进行编码时，内存中不能有数据，故先删除数据。

. clear

然后，将需要编码的文件(在此为 surname_test.dta)，放入当期工作路径(current working directory)，通常在Stata的左下角显示。

也可使用命令pwd(path of working directory)来显示当期工作路径。或使用命令cd(change directory)将当期工作路径改为文件surname_test.dta 所在的位置，详见“help cd”。

. pwd

C:\Program Files (x86)\Stata14

接下来，使用命令 unicode analyze 分析数据集 surname_test.dta 是否需要编码翻译。

. unicode analyze surname_test.dta

结果显示，有一个字符串变量需要编码翻译(1 str# variable needs translation)。为此，将编码设为国标码(GB18030)，再进行翻译。

. unicode encoding set gb18030

(default encoding now gb18030)

. unicode translate surname_test.dta

(using gb18030 encoding)

结果显示，此文件已编码翻译成功。再次打开此数据集，并通过数据编辑器 “Data Editor (Browse)” 查看：

. use surname_test.dta,clear

上表已能正确显示中国人口最多的十大姓氏依次为：王、李、张、刘、陈、杨、黄、赵、周、吴。相信朋友可以安心使用 Stata 14 了。

(c) 2016，陈强，山东大学经济学院

转载请注明作者与出处

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
stata15中文乱码_如何解决 Stata 14 的中文乱码问题？

不久前遇到一位朋友，诉说使用 Stata 14 出现中文乱码，而不得不退而使用更低版本的 Stata 的烦恼。其实，这只是因为 Stata 14 使用了 Unicode(统一码、万国码)。何为 Unicode？根据百度百科的解释，“Unicode 是计算机科学领域里的一项业界标准，包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。