request库安装方法
(1)打开命令窗口(win+R)
(2)输入cmd回车打开命令提示符窗口
(3)在命令提示符窗口输入(pip install resquests+回车)
安装成功
requests库的七个主要方法
get()方法
这是requests库最常用的方法
Response对象的属性
使用get()方法获取网页资源基本流程
(1)用[r.status_code]命令来检查返回的Response对象他的状态
(2)如果是200则用下面的命令去解析返回的内容
(3)如果状态码是404或其他,说明本次url访问因为某种原因出错或产生异常了
理解Response的编码
【r.encoding】:如果header中不存在charset,则认为编码为ISO-8859-1(默认的)
【r.apparent_encoding】:根据网页内容分析出的编码方式
爬取网页的通用代码框架
HTTP协议对资源的操作
http通过url对资源做定位,通过这常用的6个方法,对资源进行管理
每次操作都是独立且无状态的
理解patch 和 put 的区别
通过比较我们可以看出
patch的最主要好处:节省网络带宽