spider
江雁ADOR
这个作者很懒,什么都没留下…
展开
-
爬虫D4 requests库的使用
文章目录I. 简介II. 发起请求i. 请求方法1. get请求2. post方法:3. 自定义Cookies4. 设置代理5. 重定向III. 百度贴吧案例 I. 简介 Requests是有史以来下载次数最多的Python软件包之一,每天下载量超过400,000次。 Requests的官方文档同样也非常的完善详尽,而且少见的有中文官方文档:http://cn.python-requests.o...原创 2020-04-30 16:57:33 · 638 阅读 · 0 评论 -
爬虫D7 网页解析
文章目录Part I. BeautifulSoup1. 简介2. 简单例子3. 指定解析器4. 节点对象(1) Tag(2) NavigableString(3) BeautifulSoup(4) Comment5. Tag与遍历文档树6. find_all()方法7. CSS选择器Part II XPath简介语法a. 最有用的路径表达式:b. 谓语c. 选取未知节点 Part I. Beau...原创 2020-04-30 16:37:47 · 248 阅读 · 0 评论