想要练习爬虫的兄弟们,可以看看这个
如果大神们看到有哪里可以改进的地方,请告诉小弟,我是个纯纯新手,练习了几次爬虫
以前一直用的BeautifulSoup,一直没有接触过正则表达式
正则表达式是一个非常好用、实用的东西,在这里也稍微练习一下(我就是研究正则表达式的时候跑偏了,爬取了各个网站的妹子图)
为了得到进一步的练习,这里再加入多线程爬取,提高下载速度的同时,又练习了一个新知识
开始
今天爬取的是挖好图(https://www.wahaotu.com/),这个网站中的妹子图,你也可以爬取该网站的任何其他类型图片,放几个图片展示一下
首先,打开网站,随便选择其中一个类别,这里以美女图片为例