
Scrapy
GouZe1
把喜欢当做动力
展开
-
如何模拟用户登录爬取知乎
** 如何模拟用户登录爬取知乎 ** import requests # 可以读取本地的cookie送给requests try: import cookielib # Python2中叫cookielib except: import http.cookiejar as cookielib # Python3中叫做cookiej...原创 2019-05-08 20:25:47 · 920 阅读 · 1 评论 -
urllib库的使用
** urllib库中包含四个模块 ** urllib.request基本的HTTP请求模块。可以模拟浏览器向目标服务器发送请求。 urllib.error 异常处理模块。如果出现错误,可以捕捉异常。 urllib.parse 工具模块。提供URL处理方法, 比如对URL进行编码和解码。 urllib.robotpaser 用来判断哪些网站可以爬,哪些网站不可以爬。 urlli...原创 2019-05-12 22:28:37 · 303 阅读 · 0 评论 -
urllib.request.Handler模块的介绍
** urllib.request.Handler模块的介绍 ** 首先介绍下 urllib.request.BaseHandler ,它是所有其他 Handler 的父类,它提供了最基本的 Handler 的方法,例 如 default_open() 、 protocol_request() 等。 接下来就有各种 Handler 类继承这个 BaseHandler ,列举如下: HTTPDef...原创 2019-05-13 09:43:51 · 429 阅读 · 0 评论