问题:
写ut读取json文件,将json转java对象时,出现该异常。
原因:
json文件包含UTF-8的BOM不可见字符
解决:
去掉UTF-8的BOM(以UTF-8 无BOM格式编码)
基本概念:
UTF-8:为满足基于ASCII、面向字节的字符处理的需要,Unicode标准中定义了UTF-8编码方式。
BOM——Byte Order Mark,字节序标记,插入到以UTF-8、UTF-16或UTF-32编码文件开头的特殊标记,用来标记多字节编码文件的编码类型和字节顺序。
字节序分为两类:
1.Big-Endian(大端):高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。
2.Little-Endian(小端):低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。
在UFT-8编码格式的文本中,如果添加了BOM,则只用它来标示该文本是由UTF-8编码方式编码的,而不用来说明字节序,因为UTF-8编码根本就不存在字节序问题。因此,UTF-8不建议使用BOM。
参考资源:
https://zhuanlan.zhihu.com/p/365680485
https://www.cnblogs.com/qinmengjiao123-123/p/8325646.html
https://www.cnblogs.com/findumars/p/3620078.html
https://zhuanlan.zhihu.com/p/461741666
https://zhuanlan.zhihu.com/p/27222802?utm_id=0