导读
有些时候我们需要构建一个自己的数据集
来训练模型。但是,却苦于没有大量的数据,此时就需要去谷歌
、百度
、必应
搜索引擎上去爬取一些图片作为自己的数据集。
很自然的,我们就会想到写一个爬虫的程序去爬取图片,然后就开始学习scrapy
、Beautiful Soup
、Selenium
,除此之外还需要学习一些HTML
和JS
来解析网页获取我们想要的数据。这样看起来,好像点复杂。毕竟我们只是想爬取点图片,为什么要搞的如此复杂。
icrawler
就可以帮我们轻松解决这些问题,不需要去学习其他的库了,甚至连解析网页
这样的工作也不需要我们做。
icrawer
官网教程:https://icrawler.readthedocs.io/en/latest/
icrawler
是一个mini
的web爬虫框架,按照模块化的设计标准,我们能够很容易的去使用和继承它,支持图