网络爬虫
梦在waterloo
这个作者很懒,什么都没留下…
展开
-
python常用爬虫库
python爬虫常用的模块或库 urllib 标准库 Beautiful Soup http://www.crummy.com/software/BeautifulSoup/lxml http://lxml.deHTQL http://htql.net/Scrapy http://scrapy.org/Mechanize http://wwwsearch.source转载 2014-07-15 22:20:03 · 1003 阅读 · 0 评论 -
网络爬虫教程(1)
爬虫最主要的处理对象就是URL,它根据URL地址取得所需要的文件内容,然后对它 进行进一步的处理。 因此,准确地理解URL对理解网络爬虫至关重要。原创 2014-07-15 22:11:44 · 1017 阅读 · 0 评论