Java读取Unicode文件(UTF-8等)时碰到的BOM首字符问题,及处理方法
在Windows下用文本编辑器创建的文本文件,如果选择以UTF-8等Unicode格式保存,会在文件头(第一个字符)加入一个BOM标识。
这个标识在Java读取文件的时候,不会被去掉,而且String.trim()也无法删除。如果用readLine()读取第一行存进String里面,这个String的length会比看到的大1,而且第一个字符就是这个BOM。
这种情况会造成一些麻烦,比如在读取...
转载
2019-04-07 16:04:54 ·
364 阅读 ·
0 评论