2021-08-12-shell-爬取网页上的图片

最新推荐文章于 2023-08-26 21:47:36 发布

呼噜2020

最新推荐文章于 2023-08-26 21:47:36 发布

阅读量383

点赞数

分类专栏： shell 笔记 linux

本文链接：https://blog.csdn.net/qq_41111018/article/details/119655761

版权

linux 同时被 3 个专栏收录

30 篇文章 0 订阅

订阅专栏

笔记

28 篇文章 0 订阅

订阅专栏

shell

27 篇文章 0 订阅

订阅专栏

爬取网页上的图片


#!/bin/bash
#脚本功能：抓取网页上的图片并下载
URL=/root/data/day03/$$.txt #定义一个变量，$$以脚本进程命名，这里即脚本执行则生成一个txt文件
curl -s https://www.tmooc.cn/ > $URL #获取网页源代码，并保存到变量URL中，-s静默获取屏幕无输出
#开始获取图片地址
echo -e "\033[32m getting url \033[0m"
sed -i '/<img/!d' $URL
sed -i 's/.*src="//' $URL
sed -i 's/".*//' $URL
echo
#判断若未安装wget则安装
if ! rpm -q wget &>/dev/null
then
    yum -y install wget
fi
#开始下载图片
echo -e "\033[32m start install \033[0m"
for i in $(cat $URL) #使用for循环对变量URL中图片的网址进行循环
do
    wget -P /root/data/day03/image/ -q $i  #使用wget下载图片并保存到指定路径，-P指定路径，-q静默下载
done

呼噜2020

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
2021-08-12-shell-爬取网页上的图片

爬取网页上的图片#!/bin/bash#脚本功能：抓取网页上的图片并下载URL=/root/data/day03/$$.txt #定义一个变量，$$以脚本进程命名，这里即脚本执行则生成一个txt文件curl -s https://www.tmooc.cn/ > $URL #获取网页源代码，并保存到变量URL中，-s静默获取屏幕无输出#开始获取图片地址echo -e "\033[32m getting url \033[0m"sed -i '/<img/!d' $URLsed -
复制链接

扫一扫