python读取文件 \ufeff 问题

    df_ID= pd.read_csv(IDfile_path,encoding= 'utf-8',sep = ',',header=None)
    ID_list= list(df_ID.ix[:,0])
    print(ID_list)

我的原始输出:

['\ufeffee170175-35de-43b8-ad92-a70600b6da3a', '266d79c7-4ca9-483e-926a-a714013eb22b',。。。

在已经设置好读取文件编码方式的情况下,输出的首行有编码问题,出现“'\ufeff”。

解决方案:

方案一:检查原文件,Notepad++是一个很好的代码查看器,“编码”选项可以查看或重设编码方式,我发现我文件的编码是“ UTF-8 BOM”,将其改为:‘ UTF-8’

再次输出,恢复原样:

['ee170175-35de-43b8-ad92-a70600b6da3a', '266d79c7-4ca9-483e-926a-a714013eb22b'

 

方案二:查询网上的另一种方案:

item.encode('utf-8').decode('utf-8-sig').strip()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值