Requests爬取网页内容

最新推荐文章于 2024-08-31 09:47:59 发布

ydqq

最新推荐文章于 2024-08-31 09:47:59 发布

阅读量2.2k

点赞数

分类专栏： python爬虫文章标签： requests robotes 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ydydyq/article/details/100040959

版权

本文介绍了Python的Requests库的使用，包括get、head等方法，并展示了如何使用Requests获取豆瓣网页信息。同时，讲解了爬虫协议（robots协议）的重要性，如何查看robots.txt文件以遵循网站的爬取规则。

摘要由CSDN通过智能技术生成

Requests的简单用法

Requests主要方法：

requests.request() #构造一个请求，支撑以下各方法的基础方法
requests.get() #get方法获取网页
requests.head() #获取网页头信息的方法，对应HTTP的HEAD
requests.post() #post方法获取网页信息
requests.put() # put方法获取网页信息（一般用不到）
requests.patch() # patch方法请求网页信息（一般用不到）
requests.delete() #向HTML网页提交删除请求

Requests.get的用法：

import requests	# 导入方法
r = requests.get(url)		#发送请求获得相应

Response对象的属性：

r.status_code # 返回的状态码，不同状态码代表不同意思，200表示返回正常。
r.text #返回对象的文本内容
r.content #猜测返回对象的二进制形式
r.encoding #分析返回对象的编码方式
r.apparent_encoding #相应内容编码方式（备选编码方式）
r.raise_for_status() #抛出异常

爬取豆瓣网页信息

分析豆瓣短评网页是动态加载还是静态加载

在谷歌浏览器中进制js

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。