python编写的新浪微博爬虫(现在的登陆方法见新的一则微博)
最近实验室安排了个任务,写一个新浪微博的爬虫,抓取大家的微博内容进行分析。
话说都快毕业了,最近还在一家通信设备商实习(工资好少啊),无奈只能抽出晚上的时间来写这个程序。
本来想用开源的爬虫的,于是尝试了nutch和heritrix。nutch性能太不稳定了,老是出问题。heritrix功能多,复杂,跑起来也慢。
当看到这两篇博客后(http://kcclub.kingsoft.com/
原创
2012-08-28 22:08:29 ·
10071 阅读 ·
22 评论