通过爬虫访问 Excel 中存储的图片链接,并且进行图片下载
爬虫编写背景
在 Excel 中,有给出的图片链接,现在想通过这些链接,直接把图片下载下来,并且每个图片用不同的命名,进而发展出,同时下载不同的 Excel ,同时下载。
1、先想办法,通过程序获得 Excel 中的图片链接
既然是通过 Excel 中的图片链接,下载图片,我们首先做的第一步就是获取 Excel 中的图片链接:
在这个操作中我们会用到一个库「xlrd」
我们通过这个库来完成针对 Excel 的操作。
- 通过 「xlrd」库完成 Excel 内容读取,获取图片的链接,代码如下:
# 打开 Excel
data = xlrd.open_workbook(r'地址隐藏')
# 获取 表格
table = data.sheets()[0]
# 获取列的内容
mainNcols = table.col_values(3)
Excel 表格的格式如下:
2. 通过上面代理可以抽取图片的所有链接;