pandas dataFrame to_excel 报错[ UnicodeDecodeError: 'ascii' codec can't decode byte 0xe7 in position 7

问题提出

python code

import pandas as pd
df = pd.read_csv("text.csv", sep="\t")
df.to_excel("test.xlsx")

error info

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe7 in position 7: ordinal not in range(128)

解决办法

直接上 code

import sys
sys.setdefaultencoding('utf-8')
import pandas as pd
def csv2excel(fp):
    df = pd.read_csv(fp, sep="\t")
    cols = df.columns
    ## 转换每一列的编码
    for e in cols:
        df[e] = df[e].map(lambda x: str(x).decode("utf8").encode("raw_unicode_escape").decode("raw_unicode_escape")) 
        # 这里的 utf8 为 python 运行环境默认编码, 即 sys.getdefaultencoding()
        print e
    df.to_excel(fp.replace(".csv", ".xlsx"))
    print fp

if __name__ == "__main__":
    fp = "test.csv"
    csv2excel(fp)

参考资料

  1. Codec registry and base classes
  2. python encode\decode
  3. How to fix: “UnicodeDecodeError: ‘ascii’ codec can’t decode byte”
  4. PYTHON-进阶-编码处理小结
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值