python
文章平均质量分 79
NN179
这个作者很懒,什么都没留下…
展开
-
python 爬虫实现前需要注意的地方
网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。参看百度百科http://note.sdo.com/u/wyatt/n/mbnUS~jpc4spnM00k001a5最近原创 2012-07-21 17:06:07 · 6639 阅读 · 0 评论 -
百度贴吧爬虫
2011-09-28 一 代码#coding:gb2312import urllib2,urllib,re,osimport sqlite3,cookielib,time''' 百度爬虫类 @author:FC_LAMP'''class SpiderBaiDu: #变量 sqlit = None cur = None baseurl =转载 2012-07-21 16:56:17 · 2149 阅读 · 0 评论 -
python网络爬虫
#FileName: toolbox_insight.pyfrom sgmllib import SGMLParserimport threadingimport timeimport urllib2import StringIOimport gzipimport stringimport os#rewrite SGMLParser for start_aclass Baseg转载 2012-07-21 16:53:00 · 584 阅读 · 0 评论