df_ID= pd.read_csv(IDfile_path,encoding= 'utf-8',sep = ',',header=None)
ID_list= list(df_ID.ix[:,0])
print(ID_list)
我的原始输出:
['\ufeffee170175-35de-43b8-ad92-a70600b6da3a', '266d79c7-4ca9-483e-926a-a714013eb22b',。。。
在已经设置好读取文件编码方式的情况下,输出的首行有编码问题,出现“'\ufeff”。
解决方案:
方案一:检查原文件,Notepad++是一个很好的代码查看器,“编码”选项可以查看或重设编码方式,我发现我文件的编码是“ UTF-8 BOM”,将其改为:‘ UTF-8’
再次输出,恢复原样:
['ee170175-35de-43b8-ad92-a70600b6da3a', '266d79c7-4ca9-483e-926a-a714013eb22b'
方案二:查询网上的另一种方案:
item.encode('utf-8').decode('utf-8-sig').strip()