BOM字符说明

BOM字符(Byte Order Mark):

概念:

按照UTF-8的编码格式bom为0xEF 0xBB 0xBF这三个字符。编码格式只是表现形式,无论它的编码格式是什么,它的作用都是不变的。在UTF-8编码格式的文件中,它可以表示当前文件是否是UTF-8编码的,而在UTF-16(其它可以类推)中,bom具有表示字节顺序的作用,即指明两个字节中的数据谁在前谁在后(也就是大端和小端模式:https://blog.csdn.net/jason_cuijiahui/article/details/79010257

带来的问题:
在windos下用自带的记事本等如见软件保存UTF-8编码的文件时会自动在文件开始的地方插入三个不可见的字符0xEF 0xBB 0xBF,即BOM,而当我们用程序读取该记事本中的数据时这三个字符往往是不会被忽略的,甚至Trim()也无法去掉,所以就导致了一系列的问题

在C#中可以在指定编码格式时可以去掉BOM字符:


using System.Text;
var encoding = new UTF8Encoding(false);

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值