![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
网络爬虫
文章平均质量分 51
遗忘了呵呵
这个作者很懒,什么都没留下…
展开
-
爬取百度贴吧用户的帖子
在基于Python爬虫实战二之爬取百度贴吧帖子的项目–崔庆才(http://cuiqingcai.com/993.html),该项目最终爬取一个贴子的所有楼层或者只看楼主。 想到自己可以爬取一个用户的所有帖子,只需修改写入文件的方式,和正则表达式,以及一些微小改动就可以。# -*- coding:utf-8 -*-import reimport urllib2#处理页面标签类class To原创 2016-12-19 19:16:17 · 1233 阅读 · 0 评论 -
爬取爱问知识人问题并保存到数据库
前言: 基于崔庆才的(http://cuiqingcai.com/1972.htmlPython)爬虫实战六之抓取爱问知识人问题并保存至数据库 上面博客由于显示问题,可能看不到全部代码,可以通过查看网页源代码看到。自己就在题目上进行一些修改,去掉的保存所有答案,只保存好评答案,而且没有使用到Beautifulsoup,所以直接采取正则表带是匹配,所以tool.py也没有作用。 最终保存问题,提原创 2016-12-22 23:30:29 · 714 阅读 · 0 评论 -
requests库---网络爬虫
requests库简介 官方文档:requests快速上手 写的非常详细,推荐阅读官方文档。快速上手导入requests库import requests发送请求:r = requests.get('url')r = requests.post("http://httpbin.org/post")r = requests.put("http://httpbin.org/put")r = re原创 2017-04-12 11:05:28 · 415 阅读 · 0 评论