python解码gbk_Python(Chrome)编码问题: 'gbk' codec can't encode character u'\u2027'汗血宝马...

UnicodeEncodeError: ‘gbk’ codec can’t encode character u’u2027′ in position 230 39: illegal multibyte sequence

完整代码:

1

2

3

4

5

6

7

8

9

10

11

12

13In [1]: import urllib2

In [2]: import re

In [3]: web = urllib2.urlopen('https://movie.douban.com/'>

In [4]: web = urllib2.urlopen('https://movie.douban.com/')

In [5]: neirong=web.read()

In [6]: jiangrenhua=neirong.decode('UTF-8')

In [7]: print jiangrenhua

bVTDZL?w=636&h=278

根据网上的办法:

1.jiangrenhua=neirong.decode(‘UTF-8’)改为jiangrenhua=neirong.decode(‘UTF-8′,’ignore’)

2、更改python的默认编码为utf-8

import sys

reload(sys)

sys.setdefaultencoding(‘utf-8’)

输入sys.getdefaultencoding()查看

编码已经改了

但是继续输出print jiangrenhua

依然出现上面的编码错误,请问怎么解决

bVTD05?w=665&h=210

如下:

bVTD0j?w=690&h=769

试试在第一行加上:# coding: utf-8

依然不行

bVTD5D?w=650&h=526

只好用python3的ipython试试:

代码如下:

1

2

3

4

5

6

7

8

9

10

11

12In [1]: import urllib.request

In [2]: import re

In [3]: web = urllib.request.urlopen('https://movie.douban.com/'>

In [5]: neirong=web.read()

In [6]: jiangrenhua=neirong.decode('UTF-8')

In [7]: print (jiangrenhua)

最后显示地抓取内容如下:

bVTD88?w=656&h=372

最后还是想问,上面的问题使用python2.7可以怎么解决,求教求教求教???????谢谢谢谢

我的第一个爬虫:。。。。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值