Python 3 UnicodeEncodeError: 'gbk' codec can't encode错误的解决

最新推荐文章于 2024-05-23 14:55:10 发布

「已注销」

最新推荐文章于 2024-05-23 14:55:10 发布

阅读量9.4k

点赞数 4

分类专栏： Python 文章标签： python windows 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zheng_integer/article/details/55670918

版权

Python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

正在Windows上用Python 3 写一个爬虫，但是读取网页内容并且把网页内容写进txt文件的时候，出现了这个异常：

UnicodeEncodeError: 'gbk' codec can't encode character '\ue626' in position 94025: illegal multibyte sequence

Google一圈，发现几乎都是一篇东西或者一个解决方法转来转去，基本上都是encode或者decode的时候在括号里面加一个ignore参数，目的是想忽略掉无法编码的字符，感觉不算是解决问题，而是回避了问题，于是再一圈搜，搜到这个：

http://www.cnblogs.com/wangxingyao/p/4662543.html

看完之后发现，问题的原因在于Python 3里面字符串的默认编码是Unicode的，参考这里：

http://stackoverflow.com/questions/6812031/how-to-make-unicode-string-with-python3

而爬虫读取的网页上面的内容，在代码里面是存在字符串变量里的，Windows下面新建的文本文件默认的编码是gbk（Windows简体中文版的系统默认编码就是gbk），当把从网页上读取的内容写到文本文件里面去的时候，意味着把一个unicode的字符序列写入到一个编码是gbk的文件，最后就出错了，解决方法就是在打开一个文件的时候，指定文件的编码，让它以指定的编码打开：

with open('e:/test.txt', encoding='utf-8') as f:
    f.write(content)

「已注销」

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
4
评论
Python 3 UnicodeEncodeError: 'gbk' codec can't encode错误的解决

正在Windows上用Python 3 写一个爬虫，但是读取网页内容并且把网页内容写进txt文件的时候，出现了这个异常：UnicodeEncodeError: 'gbk' codec can't encode character '\ue626' in position 94025: illegal multibyte sequenceGoogle一圈，发现几乎都是一篇东西或者一个解决方法转来转去，
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。