UnicodeEncodeError:'utf-8' codec can't encode characters in position 380-382: surrogates not allowed


考虑是某些字符无法解码为utf-8的编码格式,把dataframe(meta)的元素,在编码过程中,先把无法转化为utf-8格式的字符‘ignore’掉,再进行解码。
for i in meta:
    for j in meta.index:
        meta.loc[j,i] = meta.loc[j,i].encode('UTF-8','ignore').decode('UTF-8')
最后再将DataFrame写入csv或者excel
meta.to_csv('metaData_+C_0.csv')

没有更多推荐了,返回首页

私密
私密原因:
请选择设置私密原因
  • 广告
  • 抄袭
  • 版权
  • 政治
  • 色情
  • 无意义
  • 其他
其他原因:
120
出错啦
系统繁忙,请稍后再试