Python爬虫---requests模块

最新推荐文章于 2024-08-20 17:58:09 发布

风拂杨柳

最新推荐文章于 2024-08-20 17:58:09 发布

阅读量305

点赞数 1

分类专栏：笔记文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52905567/article/details/116057238

版权

笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

requests库

requests是爬虫常用模块，必须熟练掌握。
requests的底层实现是urllib
requests更加简单易用
requests能够自行帮助我们解压网页内容

requests库的作用

作用：发送网络请求，返回响应数据

request常用方法

response =requests.get（URL）
response = requests.get(url,headers=headers)
response = requests.get(url,headers=headers，proxies=proxy)
三个输出均是状态码

response对象方法（response = requests.get(url,headers=headers)）

response.text 返回unicode格式的数据(str)，用于获取字符串，文本
response.content 返回字节流格式的数据，用于获取的是图片，或者文件
二者获取的均是HTML代码
实际上，response.text 和response.content 返回的HTML数据一样的，只是显示不一样
response.headers 返回响应头身份
response.request.headers 请求头响应

解决响应代码解析问题

response.content.decode(‘utf-8’) 手动进行解码
使用时机：当对象是图片，音频或者视频等
response.encoding() = ‘编码’
使用时机：当对象是字符串或者文本

例子

在这里插入图片描述

ip代理设置

设置代理是反反爬的一种方法，可以避免ip被封
在这里插入图片描述

requests 发送post请求

数据的请求一般在XHR选项里，以下举例上次用urllib的post请求，发现只有一条内容，很容易发现。
在这里插入图片描述

Form Data 表单

Form Data 表单是用于对URL发起post请求时作用于响应，例如网页账号密码登录的响应，网页翻译的响应

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。