最近整理一个爬虫系列方面的文章,不管大家的基础如何,我从头开始整一个爬虫系列方面的文章,让大家循序渐进的学习爬虫,小白也没有学习障碍.
爬虫篇 | 不会这几个库,都不敢说我会Python爬虫
爬虫篇 | Python现学现用xpath爬取豆瓣音乐
爬虫篇 | Python最重要与重用的库Request
爬虫篇 | Python爬虫学前普及
基础篇 | Python基础部分
这两天有读者要我出一篇使用正则表达式来抓取数据,于是这篇献上
首先需要说明的是,在数据抓取的时候,优先使用xpath,如果xpath不行再考虑正则或者bs4, 因为xpath简单且高效!
概念性的东西这里就不说了,我们直接来实战,这里只简单说明一下,详细的需要自己去查一下资料!
要爬取的图书内容:
爬取到的数据