2021-03-11

最新推荐文章于 2024-07-23 16:23:28 发布

小林的秃头史

最新推荐文章于 2024-07-23 16:23:28 发布

阅读量119

点赞数 2

分类专栏：笔记文章标签： python 爬虫

本文链接：https://blog.csdn.net/weixin_42777402/article/details/114660392

版权

笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

request库相关知识点（不全）

response响应状态码

import requests
url = "http://www.biadu.com/"
response = requests.get(url)

<Response [200]>

200系列：成功 || -200 成功；-201 创建成功
400系列：失败 || -401认证失败； -403禁止请求； -404未找到资源； -405请求方法不被允许； -408请求超时
300系列：重定向 || -301 永久性转移； -302临时性转移； -304没有更改
500系列：服务器错误 || -502网关错误； -503服务器错误； -504网关超时

text 与 content

response.text返回的是文本类型
response.content返回的字节类型
content可通过decode方法转化为text：

response.text == response.content.decode('utf-8')

一般地，图片下载也可以用response.content方法下载，具体代码如下（暂不考虑反爬因素~）：

import requests
url = "图片地址"
resp = requests.get(url)
with open('文件名','wb') as file:
    file.write(resp.content)

顺便温习一下python基础文件操作语法
1）写入操作 w，文件不存在则创建，存在则覆盖写
2）追加写操作a，文件不存在则创建，存在则追加写，指针初始位置在文件末尾，
3）覆盖写操作r+，文件不存在会报错，存在则会调用指针至文件开头，覆盖写
4）w+，a+新增了文件读取功能，对应原性质不变
5）‘b’ ：以二进制形式打开文件；‘t’：以文本形式打开文件
写到这想起之前有看过图片以文本文件展示的操作代码，有空补上

get与post请求时传参数

两种方法：一是直接以字符串拼接形式，二是利用params或data参数传参

键值对一一对应形式传参

r = requests.get(url+'?key=value&key1=value1&key2=value2')
r = requests.get(url,params={'k1':'v1','k2':'v2','k3':'v3'})

键值对一对多形式传参

r = requests.get(url+'?key=value&key=ktv&page=4')
r = requests.get(url,params={'k1':['v1','ktv'],'k3':'v3'})

post请求时同理

r = requests.post(url, data={'k1':'v1','k2':'v2'})
r = requests.post(url, data={'k1':['v1','v2'],'k3':'v3'})

代理ip

proxies = {
  'http':'http://000.000.000.000:999'
  'https':'https://000.000.000.000:999'
}
resp = requests.get(url,proxy = proxies)

后续补代理IP池管理

其它零碎知识点

cookies ={}
resp = requests.get(url,cookies = cookies)

查看跳转记录

>>> resp = requests.get(url)
>>> resp
<Response [200]>
>>> resp.history
[<Response [302]>]

值得一提的是，resp.history为列表属性

>>> type(resp.history)
<class 'list'>

先整理这么多吧，慢慢学，慢慢来~持续更新

小林的秃头史

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021-03-11

request库相关知识点（不全）response响应状态码text 与 contentget与post请求时传参数键值对一一对应形式传参键值对一对多形式传参代理ip其它零碎知识点response响应状态码import requestsurl = "http://www.biadu.com/"response = requests.get(url)<Response [200]>200系列：成功 || -200 成功；-201 创建成功400系列：失败 || -401认证失败
复制链接

扫一扫

专栏目录