requests库的使用

requests库安装

pip install requests -i https://pypi.tuna.tsinghua.edu.cn/simple

get 请求

参数类型作用
urlstr发起请求的地址
params字典url为基准地址,不包含查询参数;使用此参数会自动对 params 字典编码,然后和url拼接
headers字典请求头,发送请求的过程中请求的附加内容,携带着一些必要的参数
cookies字典携带登陆信息
proxies字典用来设置代理 IP 服务器

post 请求

post请求中的两种数据格式:json 格式表单 格式
使用 resp.headers 查看文本类型
'Content-Type': 'text/html'

get 请求和 post 请求的区别

GET请求: 就是在浏览器中输入网址加回车就是GET请求,请求参数会直接包含到网址里,例如我们在百度搜索爬虫关键字,就会包含到请求的URL中

POST请求: 大多数在提交表单时发起的,例如在登录页面输入账号密码后,点击登录后通常以POST请求将数据以表单的形式传输,不会提现在URL中

  1. 用途:GET主要用于请求数据,而POST主要用于提交数据。GET请求用于获取数据,不会改变服务器上的数据;POST请求用于创建或更新服务器上的数据。
  2. 数据传输方式:GET请求将参数附加在URL上,参数之间使用&符号分隔。POST请求则将数据放在HTTP请求的消息体中,使用特定的编码格式。

response

res = requests.get( url )

发送请求后,返回的是个 requests.models.Response 对象

Response对象成员类型
headers返回resonpse对象的头部信息
status_codehttp 请求的返回状态,若为 200 则表示请求成功
texthttp 响应内容的字符串形式,即返回的页面内容
contenthttp 响应内容的二进制形式
json()得到对应的 json 格式的数据,类似于字典

1. res.headers

即响应标头

在这里插入图片描述

2. status_code

状态码说明
200服务器正常响应
404未找到请求的内容
500服务器内部错误
503服务器临时维护
403禁止访问
301永久重定向
302重定向
303可重定向
307临时重定向
400不允许的请求
401未授权
402付款表单未提交
403禁止访问
404未找到请求的内容
405方法不受支持
406不接受 HTTP 方法
407请求的 URI 不合法
408重复请求
409冲突
410超时
411未知错误
412格式错误
413请求太大
414不允许的请求体
415未描述的错误
416不支持的媒体类型
417请求包含无效的参数
418未处理的错误,反爬虫,需修改请求头信息 ‘User-Agent’
429过载
500服务器内部错误
503服务器临时维护
504服务器遇到错误
505网络错误

3. json

json后面要加括号,例:
resp.json()

head 请求

向网页发出HEAD请求,并返回HTTP标头:
一般是在不需要文件的内容时,会使用HEAD请求获取响应头信息
在这里插入图片描述

import requests

response = requests.head('https://www.baidu.com/')

print(response .headers) 
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值