BOM字符(Byte Order Mark):
概念:
按照UTF-8的编码格式bom为0xEF 0xBB 0xBF这三个字符。编码格式只是表现形式,无论它的编码格式是什么,它的作用都是不变的。在UTF-8编码格式的文件中,它可以表示当前文件是否是UTF-8编码的,而在UTF-16(其它可以类推)中,bom具有表示字节顺序的作用,即指明两个字节中的数据谁在前谁在后(也就是大端和小端模式:https://blog.csdn.net/jason_cuijiahui/article/details/79010257)
带来的问题:
在windos下用自带的记事本等如见软件保存UTF-8编码的文件时会自动在文件开始的地方插入三个不可见的字符0xEF 0xBB 0xBF,即BOM,而当我们用程序读取该记事本中的数据时这三个字符往往是不会被忽略的,甚至Trim()也无法去掉,所以就导致了一系列的问题
在C#中可以在指定编码格式时可以去掉BOM字符:
using System.Text;
var encoding = new UTF8Encoding(false);