2019.04.17
前言
项目.properties配置文件git push之后,在IntelliJ里显示正常,但在网页版的GitLab上查看却显示乱码\uXXXX
。
原因
根据廖雪峰关于字符编码的介绍1,Unicode编码一般用两个字节2B表示一个字符,而在Unicode的基础上发展出“可变长编码”的UTF-8(ascii码用一个字节1B,汉字用三个字节3B等)。例如,字符A
用Unicode编码是二进制的00000000 01000001
,而UTF-8编码则是二进制的01000001
。可以看出如果同样是保存ascii码,UTF-8的字节数只有Unicode的一半。
而在IntelliJ里,Settings->Editor->File Encodings->Properties Files(*.properties)页可以为配置文件设置默认编码,如果选择UTF-8编码且不勾选“Transparent native-to-ascii conversion”,那么配置文件就是按UTF-8编码的;反之如果勾选“Transparent native-to-ascii conversion”,就表示要把原始字符转换成用ascii表示的Unicode编码,如下图2:
而在网页中一般<header></header>
里会有设置UTF-8编码:
<meta content="text/html; charset=utf-8" />
所以在网页上查看Unicode编码一般就会显示\uXXXX
。