一、问题描述
有过多次,在开发项目中遇见设置文件编码格式为UTF-8,但是打开该文件出现类似\u7528这样的数据,看也看不懂,也不是平常见到的乱码。这里的\u7528类似的数据,其中'\u'表示UNICODE编码,其实数据就是对应的UTF-8下的汉字。
此处"\u7528\u6237"表示"用户"
二、问题处理
下面文件的编码已被设置为UTF-8,但打开这里的原文件部分内容如下:
100001=\u7528\u6237\u540D\u6216\u8005\u5BC6\u7801\u9519\u8BEF
这里使用开发工具是IDEA,其他工具参考设置进行修改。打开IDEA的设置,找到设置编码的页面。菜单路径是File - Settings - Editor - File Encodings。
(1)设置全局编码、工程编码、文件默认编码为UTF-8.
(2)勾选native-to-ascii
(3)点击按钮Apply、OK应用即可
设置完成后配置文件UNICODE编码转换为UTF-8,\u7528转换为对应的汉字。设置完成后效果如图2-3所示。
注意如果只设置UTF-8不勾选ascii转换,则文件仍显示为\u7582格式。不能正常显示为中文。