读取XML文件报 - Content is not allowed in prolog

最新推荐文章于 2021-08-24 17:33:55 发布

oscar999

最新推荐文章于 2021-08-24 17:33:55 发布

阅读量4.7k

点赞数

CC 4.0 BY-SA版权

分类专栏： 450-操作系统及相关文章标签： xml windows

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/oscar999/article/details/8046744

450-操作系统及相关专栏收录该内容

60 篇文章

订阅专栏

本文讨论了XML文件编辑后使用DOM4j读取时报Contentisnotallowedinprolog错误的问题，解释了BOM（Byte Order Mark）在UCS编码中的作用，并提供了删除BOM表头的解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

xml 文件使用某些编辑器编辑之后，使用DOM4j读取时报Content is not allowed in prolog的错误。

关于BOM的说明如下。

在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如果接收者收到FEFF，就表明这个字节流是Big-Endian的；如果收到FFFE，就表明这个字节流是Little-Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被称作BOM。
UTF-8不需要BOM来表明字节顺序，但可以用BOM来表明编码方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8编码是EF BB BF。所以如果接收者收到以EF BB BF开头的字节流，就知道这是UTF-8编码了。
Windows就是使用BOM来标记文本文件的编码方式的。

解决方法当然是删除BOM的表头
参见
http://blog.csdn.net/oscar999/article/category/801452

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

oscar999 送以玫瑰，手留余香

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。