php 0xef 0xbb 0xbf,python基础:字符编码问题三个不可见的字符(0xEF 0xBB 0xBF,即BOM),0xef0xbb,一、用utf-8格式...

python基础:字符编码问题三个不可见的字符(0xEF 0xBB 0xBF,即BOM),0xef0xbb,一、用utf-8格式

一、用utf-8格式保存的txt文件等,如何去掉BOM头

Windows系统的txt文件在使用utf-8编码保存时会默认在文件开头插入三个不可见的字符(0xEF 0xBB 0xBF)称为BOM头,这个BOM头在python的codecs库中已经定义为常量(codecs.BOM_UTF8)

方法一:utf8temp.txt保存时选择utf-8保存1 import codecs2 data=open("utf8temp.txt",‘r‘,encoding=‘utf-8‘).read()3 data=data.encode(encoding=‘utf-8‘)4 print(data)5 #print("中文".encode(encoding=‘utf-8‘))6 print(len(data))7 if data[:3]==codecs.BOM_UTF8:8 data=data[3:]9 print(data.decode(encoding=‘utf-8‘))

输出如下:

b‘\xef\xbb\xbf\xe4\xb8\xad\xe6\x96\x87‘

9

中文

方法二:1 with open("./temp.txt","r",encoding=‘utf-8‘) as f:2 flag=13 for line in f:4 if flag==1:5 line=line[1:]#去掉txt格式为utf-8会在文件第一行开头插入6 # 三个不可见的字符(0xEF 0xBB 0xBF)--(‘.’) 7 flag=08 print(line)

方法三:直接用第三方软件去掉BOM头,用notepad++打开txt文件,选择编码...without BOM,点击保存

38771e6be2a2636e1bf4d94d6b1afe47.png

python基础:字符编码问题三个不可见的字符(0xEF 0xBB 0xBF,即BOM)

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值