友商旧系统要下架,但是我们系统有一批图片依赖他们,他们也不太配合提供,还在沟通中。先爬下来做好备份,以防万一。
对方服务器域名前缀固定,文件名我们数据库有存储,直接构造url就可以访问图片;
把图片链接放在文本文件中,一行一个;如:imgs.txt
http://xxx.yyy.com/aaa.jpg
http://xxx.yyy.com/bbb.jpg
http://xxx.yyy.com/ccc.jpg
http://xxx.yyy.com/ddd.jpg
使用wget
批量下载或者爬取图片,新建个文件夹txt放进去执行命令:
(下载的文件名就是后缀xxx.jpg)
wget -b -i imgs.txt
b:表示后台下载;过程日志默认会写到wget-log文件
i:表示从文本文件内读取链接
查看实时日志:
tail -2000f wget-log
看到日志文末finish
,表示全部执行完毕;
日志中出现的ERROR
,排查失败的原因,补下刀;