java 去掉文件中bom头_Node.js文本文件BOM头的去除方法

最新推荐文章于 2022-11-08 11:07:44 发布

weixin_39768762

最新推荐文章于 2022-11-08 11:07:44 发布

阅读量387

点赞数

文章标签： java 去掉文件中bom头

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39768762/article/details/114860327

版权

BOM

字节顺序标记(byte order mark)，是位于码点U+FEFF的统一码字符的名称。当以UTF-16或UTF-32来将UCS/统一码字符所组成的字符串编码时，这个字符被用来标示其字节序。它常被用来当做标示文件是以UTF-8、UTF-16或UTF-32编码的标记。

不同编码的字节顺序标记的表示：

编码

表示(十六进制)

表示(十进制)

UTF8

EF BB BF

239 187 191

UTF-16(大端序)

FE FF

254 255

UTF-16(小端序)

FF FE

255 254

UTF-32(大端序)

00 00 FE FF

0 0 254 255

UTF-32(小端序)

FF FE 00 00

255 254 0 0

BOM添加

UTF8编码不需要BOM, 但是我们可以手动给UTF8编码文件添加一个BOM头

const fs = require('fs');

fs.writeFile('./bom.js', '\ufeffThis is an example with accents : é è à ', 'utf8', function (err) {})

BOM移除

对于UTF8来说，BOM的有无并不是必须的，因为UTF8字节没有顺序，不需要标记，也就是说一个UTF8文件可能有BOM，也可能没有BOM。

根据不同编码的BOM不同，我们可以根据文件头几个字节来判断文件是否包含BOM，以及使用的那种Unicode编码。

BOM字符虽然起到了标记文件编码的作用，其本身却不属于文件内容的一部分，如果读取文本文件时不去掉BOM，在某些使用场景下就会有问题。例如我们把几个JS文件合并成一个文件后，如果文件中间含有BOM字符，就会导致浏览器JS语法错误。因此，使用Node.js读取文本文件时，一般需要去掉BOM。

// 对于字符串内容

function stripBOM(content) {

// 检测第一个字符是否为BOM

if (content.charCodeAt(0) === 0xFEFF) {

content = content.slice(1);

}

return content;

}

// 对于Buffer

function stripBOMBuffer(buf) {

if (buf[0] === 0xEF && buf[1] === 0xBB && buf[2] === 0xBF) {

buf = buf.slice(3);

}

return buf;

}

参考

总结

到此这篇关于Node.js文本文件BOM头去除的文章就介绍到这了,更多相关Node.js文本文件BOM头去除内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

weixin_39768762

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java 去掉文件中bom头_Node.js文本文件BOM头的去除方法

BOM字节顺序标记(byte order mark)，是位于码点U+FEFF的统一码字符的名称。当以UTF-16或UTF-32来将UCS/统一码字符所组成的字符串编码时，这个字符被用来标示其字节序。它常被用来当做标示文件是以UTF-8、UTF-16或UTF-32编码的标记。不同编码的字节顺序标记的表示：编码表示(十六进制)表示(十进制)UTF8EF BB BF239 187 191UTF-16(大...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。