request库相关知识点(不全)
response响应状态码
import requests
url = "http://www.biadu.com/"
response = requests.get(url)
<Response [200]>
200系列:成功 || -200 成功;-201 创建成功
400系列:失败 || -401认证失败; -403禁止请求; -404未找到资源; -405请求方法不被允许; -408请求超时
300系列:重定向 || -301 永久性转移; -302临时性转移; -304没有更改
500系列:服务器错误 || -502网关错误; -503服务器错误; -504网关超时
text 与 content
response.text返回的是文本类型
response.content返回的字节类型
content可通过decode方法转化为text:
response.text == response.content.decode('utf-8')
一般地,图片下载也可以用response.content方法下载,具体代码如下(暂不考虑反爬因素~):
import requests
url = "图片地址"
resp = requests.get(url)
with open('文件名','wb') as file:
file.write(resp.content)
顺便温习一下python基础文件操作语法
1)写入操作 w,文件不存在则创建,存在则覆盖写
2)追加写操作a,文件不存在则创建,存在则追加写,指针初始位置在文件末尾,
3)覆盖写操作r+,文件不存在会报错,存在则会调用指针至文件开头,覆盖写
4)w+,a+新增了文件读取功能,对应原性质不变
5)‘b’ :以二进制形式打开文件;‘t’:以文本形式打开文件
写到这想起之前有看过图片以文本文件展示的操作代码,有空补上
get与post请求时传参数
两种方法:一是直接以字符串拼接形式,二是利用params或data参数传参
键值对一一对应形式传参
r = requests.get(url+'?key=value&key1=value1&key2=value2')
r = requests.get(url,params={'k1':'v1','k2':'v2','k3':'v3'})
键值对一对多形式传参
r = requests.get(url+'?key=value&key=ktv&page=4')
r = requests.get(url,params={'k1':['v1','ktv'],'k3':'v3'})
post请求时同理
r = requests.post(url, data={'k1':'v1','k2':'v2'})
r = requests.post(url, data={'k1':['v1','v2'],'k3':'v3'})
代理ip
proxies = {
'http':'http://000.000.000.000:999'
'https':'https://000.000.000.000:999'
}
resp = requests.get(url,proxy = proxies)
后续补代理IP池管理
其它零碎知识点
- cookies
cookies ={}
resp = requests.get(url,cookies = cookies)
- 查看跳转记录
>>> resp = requests.get(url)
>>> resp
<Response [200]>
>>> resp.history
[<Response [302]>]
值得一提的是,resp.history为列表属性
>>> type(resp.history)
<class 'list'>
先整理这么多吧,慢慢学,慢慢来~持续更新