python3.6 涂鸦王国-图片-爬虫笔记

道呆二

于 2019-05-05 18:36:35 发布

阅读量937

点赞数

分类专栏： python爬虫文章标签： python 爬虫图片

本文链接：https://blog.csdn.net/lonen0517/article/details/89852836

版权

这篇博客主要介绍了如何使用Python3.6进行图片爬虫，特别是在涂鸦王国网站上。作者指出，通过修改URL中的'page=x'可以遍历所有图片目录。关键在于识别不同类型的图片链接，并利用XPath获取每个缩略图的链接。对于新旧网页的图片链接差异，需要编写特定代码来构造下载链接。最后，作者计划编写一个主程序并补充必要的导入和请求头。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述
打开第一个链接，查看详细信息

关键点在于
前一个.jpg是原图，可以通过操作字符串的方式改写得到原链接

更早时候发布的图片，链接方式不一样
在这里插入图片描述
这里写一个判断获取的src是否为空就可以区分

关键问题解决，整理下思路
1.https://www.gracg.com/p599367964217379?page=1
改变“page=x”可以得到所有的图片的目录列表------format可以操作
2.xpath得到每个缩略图所指向的图片单独链接

def get_infos(url):
    res=requests.get(url,headers=headers)
    selector=etree.HTML(res.text)

    pic_urls=selector.xpath('//div[@class="imgbox"]/a/@href

最低0.47元/天解锁文章