爬虫02--request模块

最新推荐文章于 2024-07-30 21:09:58 发布

JunYu_coding

最新推荐文章于 2024-07-30 21:09:58 发布

阅读量130

点赞数

分类专栏：爬虫文章标签： python

本文链接：https://blog.csdn.net/qq_45505100/article/details/112250680

版权

3 篇文章 0 订阅

订阅专栏

在python实现的网络爬虫中，用于网络请求发送的模块有两种，第一种为urllib模块，第二种为requests模块。urllib模块是一种比较古老的模块，在使用的过程中较为繁琐和不便。当requests模块出现后，就快速的代替了urllib模块，因此，在我们课程中，推荐大家使用requests模块。
Requests 唯一的一个非转基因的 Python HTTP 库，人类可以安全享用。
警告：非专业使用其他 HTTP 库会导致危险的副作用，包括：安全缺陷症、冗余代码症、重新发明轮子症、啃文档症、抑郁、头疼、甚至死亡。
为什么要使用requests模块

在使用urllib模块的时候，会有诸多不便之处，总结如下：

使用requests模块：

安装 pip install requests (加了s)

基本流程

–get请求

response = requests.get(url,params,headers)

 headers={
   'User-Agent': ' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36' 
 }

当请求的是文本数据,用response.text获取响应数据

page_html = response.text

当请求的是二进制数据,用response.content获取响应数据
(二进制数据例如音频，图片，视频等)

page_html = response.content

–post请求

response = requests.post(url,data,headers)

注响应数据还有response.json

关注

专栏目录