学习随笔——UTF编码——2020.11.4
- UTF是Unicode字符集的编码方式
- UTF-16与Unicode等同对待
- UTF-16编码效率最高,他适合于本地磁盘和内存之间使用,不适合网络之间传输,网络传输也容易损坏字节流
- UTF-8比UTF-16解码要更复杂,UTF-8编码是可变字节编码
- UTF-8字符集中,前128个字符是单字节编码,128-2047的是双字节编码 2048之后就是三字节编码
- UTF-8文件中,ASCII码占一个字节,中文字则占三字节长度
- UTF-8更适合网络传输
- 在线进制转换工具
- 查看十六进制代码建议使用:UltroEdit
- 网页制作建议使用:HBuilder
- 知道Unicode字符的十进制编号后,可以在html文件中利用html实体编号就可以查出来(&#实体编号)
- UTF-8+编码(UTF-8 with BOM(字节序列标记) )
- 如果接收者收到以EF BB BF开头的字节流,就知道这是UTF-8编码文件
- UTF-16+编码(UTF-16 with BOM(字节序列标记) )
- 开头的字节流是FF FE,就知道是UTF-16编码文件
- 记事本的默认编码是ANSI