去除ufeff

去除\ufeff

方法一:改变读入的编码格式

  • UTF-8
f = open('test.txt', encoding='UTF-8')  # 打开文件,以 UTF-8 编码
l = []
for line in f:
    l.append(line.strip())
print(l)

test文本

image-20201113092014946

结果输出:

image-20201113091903323

  • UTF-8-sig
f = open('new2.txt', encoding='UTF-8-sig')
l = []
for line in f:
    l.append(line.strip())
print(l)

结果输出

image-20201113092159381

参见去除 \ufeff

方法二:line.lstrip()

此外还可以用line.lstrip() 方法截掉字符串左边的空格或指定字符

f = open('test.txt', encoding='UTF-8')  # 打开文件,以 UTF-8 编码,以utf-8开头会出现\ufeff形式的编码
l = []
for line in f:
    l.append(line.lstrip("\ufeff"))
print(l)

测试结果

image-20201113093037898

突然发现结尾还有一个\n,怎么整,这时候度娘告诉俺,可以用rstrip(),rstrip()用于删除 string 字符串末尾的指定字符(默认为空格)

好么,完美,lstrip()和rstrip()配合食用更香

代码改为以下这样就好啦

l.append(line.lstrip("\ufeff").rstrip('\n'))

结果如下

l.append(line.lstrip("\ufeff").rstrip('\n'))

结果如下

image-20201113093701227

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值