python解码gbk_Python（Chrome）编码问题： 'gbk' codec can't encode character u'\u2027'汗血宝马...

最新推荐文章于 2023-06-03 07:54:00 发布

weixin_39989190

最新推荐文章于 2023-06-03 07:54:00 发布

阅读量306

点赞数

文章标签： python解码gbk

UnicodeEncodeError: ‘gbk’ codec can’t encode character u’u2027′ in position 230 39: illegal multibyte sequence

完整代码：

1

2

3

4

5

6

7

8

9

10

11

12

13In [1]: import urllib2

In [2]: import re

In [3]: web = urllib2.urlopen('https://movie.douban.com/'>

In [4]: web = urllib2.urlopen('https://movie.douban.com/')

In [5]: neirong=web.read()

In [6]: jiangrenhua=neirong.decode('UTF-8')

In [7]: print jiangrenhua

bVTDZL?w=636&h=278

根据网上的办法：

1.jiangrenhua=neirong.decode(‘UTF-8’)改为jiangrenhua=neirong.decode(‘UTF-8′,’ignore’)

2、更改python的默认编码为utf-8

import sys

reload(sys)

sys.setdefaultencoding(‘utf-8’)

输入sys.getdefaultencoding()查看

编码已经改了

但是继续输出print jiangrenhua

依然出现上面的编码错误，请问怎么解决

bVTD05?w=665&h=210

如下：

bVTD0j?w=690&h=769

试试在第一行加上:# coding: utf-8

依然不行

bVTD5D?w=650&h=526

只好用python3的ipython试试：

代码如下：

1

2

3

4

5

6

7

8

9

10

11

12In [1]: import urllib.request

In [2]: import re

In [3]: web = urllib.request.urlopen('https://movie.douban.com/'>

In [5]: neirong=web.read()

In [6]: jiangrenhua=neirong.decode('UTF-8')

In [7]: print (jiangrenhua)

最后显示地抓取内容如下：

bVTD88?w=656&h=372

最后还是想问，上面的问题使用python2.7可以怎么解决，求教求教求教？？？？？？？谢谢谢谢

我的第一个爬虫：。。。。

weixin_39989190

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python解码gbk_Python（Chrome）编码问题： 'gbk' codec can't encode character u'\u2027'汗血宝马...

UnicodeEncodeError: ‘gbk’ codec can’t encode character u’u2027′ in position 230 39: illegal multibyte sequence完整代码：12345678910111213In [1]: import urllib2In [2]: import reIn [3]: web = urllib2.urlopen...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。