UnicodeEncodeError: 'gbk' codec can't encode character u'\xa9' in position 28714: illegal multibyte

在尝试运行爬虫代码时遇到UnicodeEncodeError,'gbk'编码无法处理特定字符。尽管在网上查找了大量资源并尝试解决,但问题仍未解决。最终发现是编码设置问题,改为utf-8后,代码成功运行。这是一个关于Python编码问题的解决经历。
摘要由CSDN通过智能技术生成

这个错误真的是好心塞,因为同样的代码,在别人的机器上可以运行,但不知道为什么我的就报这样的错

然而我的25行只是将获取到的源码打印

这个错几乎折磨了我一天一夜,在网上找了各种博客,试着照着他们的改了,然并卵。后来找到了一篇特别详尽的博客,http://www.crifan.com/unicodeencodeerror_gbk_codec_can_not_encode_character_in_position_illegal_multibyte_sequence/

本以为这回应该能解决了,结果。。。更伤心了

后来猜想既然其他人的可以运行,是不是我自己设置的问题,可是,我编码方式都是默认的啊!要了个截图一看,没想到还真是,这个要改成utf-8的才对,因为html默认编码是utf-8

好了,第一个网页爬虫就如此艰难的实现了!!其实代码很简单,只是编码那边真的搞得头都大了,不说了,上代码

# -*-coding:utf-8-*-
# 注意:utf-8一定要写在第一行
<pre style="font-family: Consolas; font-size: 10.5pt; background-color: rgb(255, 255, 255);"><span style="background-color:#ffe4ff;">__author__</span> = <span style="color:#008000
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值