0.学习路径示意图
上一期博主讲到如何利用虚拟浏览器chrome driver去处理动态网站,这一期博主将介绍如何使用商业爬虫框架Scrapy去处理静态网站,关于动静态网站,博主在上期的开头已经有所介绍,这里就不过多赘述了。
Chrome Driver爬取动态网站
阿力阿哩哩,公众号:Python机器学习体系Python网络爬虫---chrome driver爬取微博(教你十分钟几十行代码利用虚拟浏览爬取财宝宝微博长文)
1.Scrapy简介
Scrapy,Python开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和