python utf8格式文件转ansi格式的坑

最近在写python大作业的微信爬虫,遇到了一个问题,用csv.writer(),writer.writerow()方法向CSV文件写入数据后,在Excel中打开时中文是乱码。经查阅各种技术文章了解到需要进行转码,按照教程写了相应的代码,但是还是运行就报错,最后在某个犄角旮旯发现了解决办法,就发出来,希望不会有更多的人掉进这个坑里。
代码如下:

def utf8_to_ansi():     
        fp_ansi = open('./输出.csv','wb')	#转码后输出的文件
        fp_utf8 = open('./_result.csv','rb')	#待转码的文件
        data = ""
        data = fp_utf8.read()
        data = data.decode('utf-8')	#以二进制格式读入的数据需要先转码(转为内部码)才可以继续转换
        data = data.encode('mbcs',errors = 'ignore')	#关键,将内部码再次编码
        fp_ansi.write(data)		#写入文件
        fp_ansi.close()
        fp_utf8.close()

代码不长,但是这个过程中的errors = 'ignore’很关键,加上这句话就会自动忽略无法编码的字符,否则遇到不能编码成ascii的字符就会抛异常干掉程序
需要的原因:部分utf8编码的字符无法转换为ascii,只能丢弃

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值