python requests模块作用_浅析Python requests 模块

最新推荐文章于 2024-08-24 16:34:12 发布

weixin_39682412

最新推荐文章于 2024-08-24 16:34:12 发布

阅读量777

点赞数

文章标签： python requests模块作用

Python requests 模块

requests 模块是我们使用的 python爬虫模块可以完成市场进80%的爬虫需求。

安装

pip install requests

使用

requests模块代码编写的流程：

- 指定url

- 发起请求

- 获取响应对象中的数据

- 持久化存储

-------------案例-------------------------

import requests

# 指定url

url="https://www.sogou.com/"

# 发起请求

response = requests.get(url)

# 获取响应对象中的数据

page_text = response.text

# 持久化存储

with open('./sogou.html','w',encoding='utf-8') as fp:

fp.write()

-------------------------------------------

参数

# post 数据

response = requests.post(url=url,data=data,headers=headers)

# get 数据

response = requests.get(url=url,data=data,headers=headers)

# 返回二进制数据

response.content

# 返回字符串数据

response.text

# 返回json对象

response.json()

其他了解

1、该模块实现爬取数据前需要查找需要爬取数据的指定URL，可通过浏览器自带抓包功能。

# 浏览器抓取 Ajax 请求

F12 --> Network --> XHR --> Name --> Response

2、上面的headers参数是进行UA伪装为了反反爬

反爬机制：UA检测 --> UA伪装

3、下面是http我们爬包是常用的请求头参数

- accept: 浏览器通过这个头告诉服务器，他所支持的数据类型

- Accept-Charset：浏览器通过这个头告诉服务器，它支持那种字符集

- Accept-Encoding：浏览器通过这个头告诉服务器，支持的压缩格式

- Accept-Language：浏览器通过这个头告诉服务器，他的语言环境

- Host：浏览器同过这个头告诉服务器，想访问哪台主机

- If-ModifiedSince：浏览器通过这个头告诉服务器，缓存数据的时间

- Heferer：浏览器通过这个头告诉服务器，客户及时那个页面来的，防盗链

- Connection：浏览器通过这个头告诉服务器，请求完后是断开链接还是保持链接

- X-Requested-With：XMLHttpRequest 代表通过ajax方式进行访问

- User-Agent：请求载体的身份标识

以上就是浅析Python requests 模块的详细内容，更多关于Python requests 模块的资料请关注脚本之家其它相关文章！

weixin_39682412

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。