
爬虫
文章平均质量分 74
蓬莱道人
半路出家的研究僧
展开
-
爬虫入门:(二)爬虫请求库urllib和requests
1、urllib库 请求模块 urllib.request 异常处理模块 urllib.error url解析模块 urllib.parse robotx.txt模块 urllib.robotparse (1)请求与响应 函数原型: urllib.request.urlopen(url, data = None, [timeout,]*, cafile = None, capath = None, cadefault = False,c...原创 2020-06-24 21:10:52 · 642 阅读 · 0 评论 -
爬虫入门:(一)HTTP协议
1、Request包含什么:(1)Request Method:请求方式,如get、post、put、delete、head(只返回response对象的Res Headers)(2)Request URL:请求URL,请求的统一资源定位符,访问网页时第一次请求是document请求,然后是解析其中的URL,然后发起script、png、gif、JPEG、video等请求(3)Request He...原创 2018-04-17 20:39:28 · 491 阅读 · 0 评论