由于mac和一般windows电脑编码方式不同,处理好的数据传过来经常出现乱码。引用陈强老师的解决方案,十分有效!
*分析该dta的编码方式
unicode analyze surname_test.dta
*设置默认编码
unicode encoding set gb18030
*将dta文件编码进行转换
unicode translate surname_test.dta
*重新导入数据
use surname_test.dta,clear
2021-3-3更新
部分情况下gb18030不能完全转换,导致个别变量仍是乱码。这将导致整个文件无法成功转换。在这种情况下可以采用以下方式,忽略掉无法转换的内容,保证大部分乱码可以被转换。
unicode retranslate surname_test.dta,invalid