python爬虫
温别Serein
YOLO
展开
-
BeautifulSoup库的理解与使用
1.什么是BeautifulSoup库 Beautiful Soup库是解析,遍历,维护"标签树"的功能库原创 2019-11-23 13:03:55 · 648 阅读 · 0 评论 -
Request对象的方法
一.Http协议的方法 1.GET 请求url资源 2.HEAD 获取url位置资源的响应报告,即获取该资源的头部信息 3.POST 请求向url位置的资源附加新的数据 4.PUT 请求向url位置存储一个资源,覆盖原来位置的资源 和post方法相同,但是put方法会覆盖原来的资源 5.PATCH 请求局部更新url资源 6.DELETE 请求删除u...原创 2019-11-01 15:05:26 · 195 阅读 · 0 评论 -
Response对象的属性
1.r.status_code 返回200代表访问成功,其他值都代表访问失败 2.r.text 返回页面的内容 3.r.encoding 返回从Http header中猜测的编码方式 一般是从头部的charset字段获取到 如果不存在charset字段,默认为'ISO-8859-1' 4.r.apparent_encoding 一种备选的编码方式-从内容中分析出来的 5.r....原创 2019-10-31 14:59:31 · 1353 阅读 · 0 评论 -
Request库的安装和测试
一.什么是Request库? python的第三方库,目前爬取网页最好的工具,简单,简洁 二.Request库的安装 1.命令行输入以下内容 2.测试是否安装成功 ...原创 2019-10-31 14:48:22 · 2134 阅读 · 1 评论