Shell—爬取网页图片

  最近看到一个非常好玩的东西,在此做一下分享,爬取网页的图片自动下载到本地目录(可以使用wget 或 curl命令)。那么先用来爬取一些美女图片吧,爬一组舒淇照片,指定 .jpg格式
  给个热心网址,“http://www.mingxing.com/mingxing/tuku/name/shuqi.html”,下面就拿这个网址来爬取,先贴张性感的养眼照片
          12

源文件如下:

#!/bin/bash

if [ $# -ne 3 ]
then
	echo "Usage: $0 URL -d DIRECTORY"
	exit -1	
fi
while [ $# -gt 0 ]
do
	case $1 in
	-d) 
		shift; directory=$1; shift # shift用来左移参数位置
		;; 
	*) 
		url=$1; shift
		;;
	esac
done
mkdir -p $directory
baseurl=$(echo $url | egrep -o "https?://[a-z.\-]+")
echo Downloading $url
curl -s $url | egrep -o "<img[^>]*src=[^>]*>" | sed 's:<img[^>]*src=\"\([^"]*\).*:\1:g' | sed "s,^/,$baseurl/," | egrep "*.jpg" > /tmp/$$.list
cd $directory
while read filename
do
	echo Downloading $filename
	curl -s -O "$filename" --silent
done < /tmp/$$.list

执行后
@xiaoma
到此完毕…

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Caso_卡索

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值