Python urllib2报错"UnicodeDecodeError: 'utf8' codec can't decode byte 0xa1"

最新推荐文章于 2024-08-03 19:27:22 发布

clliu

最新推荐文章于 2024-08-03 19:27:22 发布

阅读量5.9k

点赞数 1

分类专栏： Python 文章标签： python urllib2 乱码

本文链接：https://blog.csdn.net/clliu/article/details/53517632

版权

Python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

用python的urllib2抓取web页面时发现中文显示的乱码：

import urllib2

#获取手机号的归属地
url = "http://www.ip138.com:8080/search.asp?action=mobile&mobile=1380013"
request = urllib2.Request(url)
request.add_header('User-Agent', 'AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36')

response = urllib2.urlopen(request).read()
print response

返回结果有乱码？解码：

print response.decode("UTF-8")

结果报错：

UnicodeDecodeError: 'utf8' codec can't decode byte 0xa1 in position 251: invalid start byte

最终发现，该接口返回页面用的字符集是gb2312，如图：

正确的方法：

print response.decode("gb2312")

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

clliu

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python urllib2报错"UnicodeDecodeError: 'utf8' codec can't decode byte 0xa1"

用python的urllib2抓取web页面时发现中文显示的乱码：import urllib2#获取手机号的归属地url = "http://www.ip138.com:8080/search.asp?action=mobile&mobile=1380013"request = urllib2.Request(url)request.add_header('User-Agent',
复制链接

扫一扫