天蛛爬虫学习笔记——Requests
1、Requests方法
1.1、request(method,url,**kwargs)构造一个请求,支撑一下各方法的基础方法,method包括下列的几个方法
1.2、get(),获取HTML网页的主要方法
1.3、 head()获取HTML网页头信息
1.4、post()向HTML网页提交POST请求
1.5、put()向HTML网页提交PUT请求,会全部覆盖之前的信息
1.6、patch()向HTML网页提交局部修改请求
1.6、delete()删除请求
由于网页的限制,一般不需要我们提交信息,所以最常用的方法是get()和head()
2、对象Request和Response的属性
2.1、status_code 查看请求的返回状态码,200表示连接成功
2.2、encoding,从header中分析编码方式
2.3、apparent_encoding,从内容中分析编码方式
2.4、content ,HTTP响应的二进制内容
从header中获取的编码格式不一定是内容的编码格式,所以通常会r.encoding=r.apparent_ebcoding或者是r.encoding=“UTF-8”
3、异常
3.1、ConnectionError, 网络连接异常,如DNS查询失效,拒绝连接