python获取html编码GB2312中文乱码的问题

最新推荐文章于 2023-09-09 20:58:28 发布

飞奔的猫

最新推荐文章于 2023-09-09 20:58:28 发布

阅读量1.3k

点赞数 1

分类专栏： python 文章标签： python BeautifulSoup 乱码

本文链接：https://blog.csdn.net/jylonger/article/details/45843971

版权

python 专栏收录该内容

62 篇文章 5 订阅

订阅专栏

GB18030涵盖了GB2312和GBK

# coding:utf-8

import sys
import urllib2
import re
from BeautifulSoup import BeautifulSoup

reload(sys)
sys.setdefaultencoding('utf-8')

url='http://www.led.hc360.com/'
request = urllib2.Request(url)
response = urllib2.urlopen(request,data=None,timeout=30)
htmlpage = response.read()
soup = BeautifulSoup(htmlpage,fromEncoding="GB18030")  #重点使用fromEncoding="GB18030"
a_title = soup.find("title")
print a_title

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

飞奔的猫

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python获取html编码GB2312中文乱码的问题

GB18030涵盖了GB2312和GBK# coding:utf-8import sysimport urllib2import refrom BeautifulSoup import BeautifulSoupreload(sys)sys.setdefaultencoding('utf-8')url='http://www.led.hc360.com/'reques
复制链接

扫一扫