pycharm安装requests前要安装urllib3,因为我自己安装的时候,没装urllib3直接requests报超时之类的错!!!
检查网页源代码charset 查看编码方式
== respond=requests.get(‘url’,params={‘a’:1},headers=headers,cookies=cookies,proxies=proxies,verify=false,stream=True) ==
params:以字典的形式传递参数
headers:字典的形式构造
cookies:字典的形式构造
proxies:字典的形式构造(添加代理用的)
verify:忽略安全证书验证开启抓包工具时一定要验证
stream:实现流下载边读边下载
**requests 编码方式 **
它存在自动识别网页的编码格式,进而自己转化。当我们看到出现乱码的时候,说明它识别错误
.encoding() 这个方法可以查看它识别出来的编码格式
如果知道网页的编码格式可以例如:respond.encoding=‘utf-8’
响应处理
text 文本
content 二进制数据
json 返回的内容必须是json格式的
重定向
默认自动跟踪
session
respond = requests.session().post…
使用session会话时会自动帮你传输cookies数据
在向同一个主机发送多个请求 session会重用底层的tcp链接(节省时间大约节省三分之二的时间)(客户端>tcp>http
实例模拟登录
1.弄清楚流程理清人为登录的过程
知道什么在哪里找到 不可能无缘无故产生的数据 (服务端返回的数据或者js生成的数据)
处理并携带数据访问 (用session就不用在管cookie了 它会自动携带)