UTF-8编码
变长编码,每个文字符号用1~4个字节表示。
编码规则:
0xxxxxxx //文字符号0~127(ASCII)
110xxxxx 10xxxxxx //128~2047
1110xxxx 10xxxxxx 10xxxxxx //2048~65535
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx //65535~0x10ffff
go注意
Go
的源文件总是以UTF-8
编码,文本字符串也优先采用UTF-8
编码。
将字符串转换成Unicode
码点序列r := []rune(string)
码点值小于256
的文字符号可以写成单个十六进制转义的形式,例如:'A'
写成'\x41'
更高的码点必须用\u
或\U
转义