用Python多线程爬取图片并下载到本地

最新推荐文章于 2024-06-05 13:50:02 发布

橘子女侠

最新推荐文章于 2024-06-05 13:50:02 发布

阅读量4.8k

点赞数 13

分类专栏： Python安全开发 python爬虫

本文链接：https://blog.csdn.net/qq_38684504/article/details/99737184

版权

1、图片信息的来源

彼岸桌面网址为：http://www.netbian.com/

2、分析网站

（1）构造页面的url列表

我们需要做的是爬取网站上给定页数的图片，所以，我们首先需要的就是观察各个页面链接之间的关系，进而构造出需要爬取页面的url列表。

第一页的链接：http://www.netbian.com/

第二页的链接：http://www.netbian.com/index_2.htm

......

可以看出，从第二页开始之后的页面链接只是后面的数字不同，我们可以写个简单的代码，获取页面的url列表

# 页面链接的初始化列表
page_links_list=['http://www.netbian.com/']

#获取爬取的页数和页面链接

pages = int(input('请输入你想爬取的页数：'))
if pages > 1:
    for page in range(2, pages + 1):
        url = 'http://www.netbian.com/index_' + str(page) + '.htm'
        page_links_list.append(url)
else:
    page_links_list=page_links_list
print(page_links_list)

结果如下：

请输入你想爬取的页数：5
['http://www.netbian.com/', 'http://www.netbian.com/index_2.htm', 'http://www.netbian.com/index_3.htm', 'http://www.netbian.com/index_4.htm', 'http://www.netbian.com/index_5.htm']

（2）获取一个页面中所有的图片的链接

我们已经获取了所有页面的链接，但是没有获取每张图片的链接，所以，接下来我们需要做的就是获取一个页面中的所有图片的链接。在这里，我们以第一页为例，获取每张图片的链接，其他页面类似。

首先在页面中右键->查看元素，然后点击查看器左边的那个小光标，再把鼠标放在随意一个图片上，这样就定位到这个图片所在的代码位置了；我们可以知道，每个页面有18张图片，接下来，我们需要采用标签去定位页面中的图片的具体位置，如下图所示，我们使用 div.list li a img 刚好定位到了18个img标签。img标签中就包含了我们需要的图片链接。

接下来，我们以第一个页面为例，获取每个图片的链接。

import requests
from bs4 import BeautifulSoup

# 页面链接的初始化列表
url='

最低0.47元/天解锁文章

橘子女侠

关注

13
点赞
踩
46

收藏

觉得还不错? 一键收藏
2
评论
用Python多线程爬取图片并下载到本地

1、图片信息的来源彼岸桌面网址为：http://www.netbian.com/2、分析网站（1）构造页面的url列表我们需要做的是爬取网站上给定页数的图片，所以，我们首先需要的就是观察各个页面链接之间的关系，进而构造出需要爬取页面的url列表。第一页的链接：http://www.netbian.com/第二页的链接：http://www.netbian.com...
复制链接

扫一扫

专栏目录