- 博客(2)
- 资源 (2)
- 收藏
- 关注
原创 爬取爱问知识人问题并保存到数据库
前言: 基于崔庆才的(http://cuiqingcai.com/1972.htmlPython)爬虫实战六之抓取爱问知识人问题并保存至数据库 上面博客由于显示问题,可能看不到全部代码,可以通过查看网页源代码看到。自己就在题目上进行一些修改,去掉的保存所有答案,只保存好评答案,而且没有使用到Beautifulsoup,所以直接采取正则表带是匹配,所以tool.py也没有作用。 最终保存问题,提
2016-12-22 23:30:29 707
原创 爬取百度贴吧用户的帖子
在基于Python爬虫实战二之爬取百度贴吧帖子的项目–崔庆才(http://cuiqingcai.com/993.html),该项目最终爬取一个贴子的所有楼层或者只看楼主。 想到自己可以爬取一个用户的所有帖子,只需修改写入文件的方式,和正则表达式,以及一些微小改动就可以。# -*- coding:utf-8 -*-import reimport urllib2#处理页面标签类class To
2016-12-19 19:16:17 1221
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人