今天去上班,经过前台!前台妹子突然叫住了我问:哪种多肉最适合养啊 ,心里有点小失落。以为会问我今天下班后有没有空呢!原来是问多肉怎么养!我:多肉很容易养的,就是品种啥的比较多,你等我十分钟咯,等会我发到微信上,对了。你把微信告诉我一下,小样,不管结果如何,先把微信弄到手再说!
工具
肯定是Python!毕竟是世界上最好的语言,没有之一!无所不能,哈哈哈哈
反正我在学PY的过程中是越学越有趣,基本没有它做不到的事情好了,废话不多说了,本来只打算贴一下代码的,发现还是不合适,把原理也简单的给大家分析一波!
首先,当然是写个爬虫爬取我们想要的多肉数据啦。这里我们选择的网站是:
http://www.mengsang.com/duorou/list_1_1.html
网站大概长这样:
网站每页都有几十种多肉,通过点击下一页,我们可以很容易地发现该网站每页数据的链接格式为:
http://www.mengsang.com/duorou/list_1_{页码}.html
总的页数则可以通过xpath在页面上提取到:
于是,我们可以轻松地获得所有的数据页链接的列表: