关闭

python抓网页中文乱码问题

标签: pythonimport
873人阅读 评论(0) 收藏 举报
import urllib2
import sys
content = urllib2.urlopen("http://www.higis.cn").read()   #网站页面是utf-8编码的。

type = sys.getfilesystemencoding()   # 关键
print content.decode("UTF-8").encode(type)  # 关键

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:70473次
    • 积分:846
    • 等级:
    • 排名:千里之外
    • 原创:8篇
    • 转载:42篇
    • 译文:0篇
    • 评论:3条
    文章分类