JAVA从UTF-8编码文件读取字符串时，前边有问号的问题

最新推荐文章于 2024-08-20 04:38:40 发布

llllllllll4er5ty

最新推荐文章于 2024-08-20 04:38:40 发布

阅读量6.1k

点赞数

分类专栏： java 文章标签： java 问号文件读取

java 专栏收录该内容

17 篇文章 1 订阅

订阅专栏

最近做Java读取一个xml文件模板的时候，发生了一个诡异的问题。就是读出来的字符串，调试的时候显示是正常的，但是真正用的时候或者打印出来的时候，前边有一个问号。?<xml>...</xml>，类似这样。

后来在网上搜了一下，找到这个：http://bugs.java.com/bugdatabase/view_bug.do?bug_id=4508058 对于有BOM的UTF-8编码文件时，从jdk1.4开始就会在读取的时候出现这个?了。而且官方明确表示won't fix，所以现在用jdk6的时候仍然存在。

解决办法其实就是改变文件的编码，改成无BOM的UTF-8就OK了。

BOM（byte order mark）是为 UTF-16 和 UTF-32 准备的，用于标记字节序（byte order）。微软在 UTF-8 中使用 BOM 是因为这样可以把 UTF-8 和 ASCII 等编码明确区分开，但这样的文件在 Windows 之外的操作系统里会带来问题。「UTF-8」和「带 BOM 的 UTF-8」的区别就是有没有 BOM。即文件开头有没有 U+FEFF。

比如在editplus里可以选这个：

选择存为UTF-8即可，UTF-8即为无BOM

llllllllll4er5ty

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

目录

分类专栏

java 17篇
LeetCode 3篇
maven 1篇
mac 1篇
idea 5篇
mui 1篇
windows 1篇

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。