python爬虫html爬不全怎么办_Python爬虫教程-35-编程常见问题解决方法

weixin_39625008

于 2020-12-03 06:28:49 发布

阅读量4.2k

点赞数

文章标签： python爬虫html爬不全怎么办

原文：https://blog.csdn.net/qq_40147863/article/details/81673694blog.csdn.net1.通用的解决方案：【按住Ctrl键不送松】，同时用鼠标点击【方法名】，查看文档2.TypeError: POST data should be bytes, an iterable of bytes, or a file object. It ca...

摘要由CSDN通过智能技术生成

原文：https://blog.csdn.net/qq_40147863/article/details/81673694blog.csdn.net

1.通用的解决方案：【按住Ctrl键不送松】，同时用鼠标点击【方法名】，查看文档

2.TypeError: POST data should be bytes, an iterable of bytes, or a file object. It cannot be of type str.

问题描述：【类型错误】就是数据的类型应该是bytes类型，而不是str类型

解决方案：

data = data.encode('utf-8')

3.爬取得到的HTML在一行显示

调试步骤：通过print(type(html))查看html的类型, 可以查出是bytes类型，就需要解码

解决方案：

html = html.decode()

4.有时候使用爬虫会被网站封了IP，所以需要去模拟浏览器

解决方案：

header = {"User-Agent": "mozilla/4.0 (compatible; MSIE 5.5; Windows NT)"}

req = request.Request(url=base_url,data=bytes(data,encoding='utf-8'),headers=header)

5.当服务器返回json格式的数据乱码

调试步骤：1.通过print(type(json_data))查看数据的类型,

2.可以查出是str类型，

最低0.47元/天解锁文章

weixin_39625008

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
python爬虫html爬不全怎么办_Python爬虫教程-35-编程常见问题解决方法

原文：https://blog.csdn.net/qq_40147863/article/details/81673694blog.csdn.net1.通用的解决方案：【按住Ctrl键不送松】，同时用鼠标点击【方法名】，查看文档2.TypeError: POST data should be bytes, an iterable of bytes, or a file object. It ca...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。