如果爬虫不是为了抓取小姐姐照片的话,那就毫无意义
和以往一样,写文章不是为了其他,只是单纯记录一下自己的学习生活,此文就是为了记录学习经历(小姐姐)而写的。
正文:
本文依旧是照着崔大书上内容完成的,没办法自己太菜了,只有边看边写才能维持生活这样子......
虽然是照着书上写,但是由于时间关系,返回的数据格式还是有一些改变,因此代码有几处被我改动了。
总结以下几点需要注意的地方:
- 在作者当时可以直接获取到图片的URL,现在就就不行了,现在data数据里只有一个image_list列表,里面是图片的URL,但是全是小图,要想采集大图必须把URL中的list改为large才行:
- 再有就是data数据里面不是每一项都包含了title字段的,所以采集之前必须先判定一下title字段是否存在,还有iamge_list也是一样,有些是没有这个信息的,如图:
- 为了保证图片名不重复,使用md5()提取图片摘要进行命名
- 在构建文件名的时候一定要细心细心再细心啊ÿ