以校花网为例进行爬取,校花网:http://www.xiaohuar.com/,让你体验爬取校花的成就感。
想爬哪就爬哪
Scrapy,Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据
Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等
整体架构大致
以校花网为例进行爬取,校花网:http://www.xiaohuar.com/,让你体验爬取校花的成就感。
想爬哪就爬哪
Scrapy,Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据
Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等
整体架构大致