python 爬虫解析页面的编码问题

最新推荐文章于 2021-06-01 16:18:01 发布

菜鸡6666

最新推荐文章于 2021-06-01 16:18:01 发布

阅读量323

点赞数

分类专栏： requests 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43639743/article/details/108368477

版权

requests 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

根据requests请求回来的页面进行解码，直接调用即可；

        def code_conversion(self,response):
        '''
        解决requests的编码问题
        :param response: requests库请求过来的响应体
        :return:
        '''
        html = response.content
        htmltxt = ''
        encode_type = chardet.detect(html)['encoding']
        if encode_type == None:
            try:
                htmltxt = gzip.decompress(html).decode('GB2312', 'ignore')
            except Exception as aa:
                print(aa)
                print('使用压缩文件转换编码时出现了问题')
        else:
            try:
                htmltxt = response.content.decode(str(encode_type), 'ignore')
            except Exception as ee:
                print(ee)
                print('编码格式出现了问题，需要转换的编码为',encode_type)
        return htmltxt

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 爬虫解析页面的编码问题

根据requests请求回来的页面进行解码，直接调用即可； def code_conversion(self,response): ''' 解决requests的编码问题 :param response: requests库请求过来的响应体 :return: ''' html = response.content htmltxt = '' encode_type =
复制链接

扫一扫

专栏目录

菜鸡6666 CSDN认证博客专家 CSDN认证企业博客

码龄6年

36: 原创

39万+: 周排名

3万+: 总排名

6万+: 访问

: 等级

680: 积分

80: 粉丝

109: 获赞

20: 评论

247: 收藏

私信

关注

热门文章

分类专栏

js逆向 2篇
浏览器模拟操作 1篇
requests 3篇
airtest 1篇
python基础 9篇
selenium 7篇
工具 6篇
前端 2篇
redis 1篇
vue 2篇
xpath 3篇
内网穿透 1篇
数据统计工具 1篇
google Analytics 1篇
chrome 1篇
css 2篇
crontab 1篇
android反编译 1篇

最新评论

python loguru 日志数据代码模块+飞书消息通知
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%,大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
浏览器内存漫游查验js加密代码
m0_71902717: 修改路径还是显示未定义
Pycharm from XXX import XXX 引入本地文件标红报错
小肥的姐姐: 十分感谢，成功了
cookie str类型与dict互转
青年创新进群引导: 终于找到可以用的方法了，天啊，谢谢你！
google Analytics 自定义事件的设置与获取（埋点）
KoeruZ: 你可以在设置缓存啊

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。