python读取文件BOM字符处理
在windows上使用open打开utf-8编码的txt文件时开头会有一个多余的字符\ufeff,它叫BOM,是用来声明编码等信息的,但python会把它当作文本解析。
对UTF-16, Python将BOM解码为空字串。然而对UTF-8, BOM被解码为一个字符\ufeff。
如何去掉bom字符?
解决修改encoding为utf-8_sig或者utf_8_sig
open('1.txt', encoding='utf_8_sig' )
[带 BOM 的 UTF-8」和「无 BOM 的 UTF-8」有什么区别?网页代码一般使用哪个?]
from:http://blog.csdn.net/pipisorry/article/details/44136297