php中实现图片批量打包下载,bash搭配php批量下载图片实现代码

看到一个图片网站,很多漂亮图片,所以想要保存下来. 但是图片太多了.一个一个右键保存的话,不知道要保存到什么时候.

批量保存的话,Linx中好像还没有像迅雷那样的保存本网页所有图片的选项,况且,有好多好多的网页都需要保存.一个一个网页打开的话也太慢了. 所以就想找个方便的方法.于是就有了这篇文章.

使用bash和php配合一下 具体分工:

php负责获取目标网页的源代码,然后提取出图片的地址,输出为地址列表文件,然后用bash写成sh脚本,在脚本中使用wget工具批量下载,在下载的过程中重命名文件.

为什么要写成sh脚本呢?因为直接使用wget下载文件的过程中,虽然可以使用-O参数重命名文件,但是那是对下载单个文件而言的.

当使用-i参数从一个下载地址列表中依次读取下载地址来下载的时候无法重命名.也即-i 和-O参数无法同时使用.

解决办法

首先是php部分获取源代码,然后提取图片地址

$str =file_get_contents('http://127.0.0.1/?p=20');

$list = array(); //这里存放结果map

$c1 = preg_match_all('//', $str, $m1); //先取出所有img标签文本

for($i=0; $i

{ //对所有的img标签进行取属性

$c2 = preg_match_all('/(w+)s*=s*(?:(?:(["'])(.*?)(?=2))|([^/s]*))/', $m1[0][$i], $m2); //匹配出所有的属性

for($j=0; $j

{ //将匹配完的结果进行结构重组

$list[$i][$m2[1][$j]] = !empty($m2[4][$j]) ? $m2[4][$j] : $m2[3][$j];

}

}

$fp=fopen("url.txt","a");//打开文件,指针指向文件尾部进行追加

foreach($list as $list=>$sum)

{

if(preg_match('/http://127.0.0.1.*?/i',$sum['src']))//对结果进行筛选,筛选条件不唯一

{ $out= $sum['src']."n";

echo $out."
";

fwrite($fp,$out);//将结果追加到文件尾部

}

}

fclose($fp);//关闭写入文件

echo "write OK";

?> 此处的img标签匹配条件不唯一.看个人的需求了.也不一定要把所有的img都匹配出来.可以在匹配img标签之前就进行筛选.我这样做是为了方便吧,省事.呵呵

我是先把 img标签全部匹配,然后再用preg_match函数把想要的地址留下来. 再说一遍,方法不唯一

这样得到一个url.txt文件,里面是下载地址列表,每行一个.

然后是bash登场

#!/bin/bash

count=0

while read line

do

wget -O $count.jpg $line

((count+=1))

#使用let count=$count+1 也正确

#使用((count++)) 也正确

done

chmod +x img.sh 然后就可以执行了

./img.sh url.txt 这样 就间接的完成了-i 和-O参数同时使用,重命名是按照下载顺序,保存为 1.jpg 2.jpg 3.jpg ....

上面是在一个网页中进行保存,想要保存所有的图片话,就先获取归档页面中的地址列表,然后顺序访问地址数组,每访问一个地址,用上面说到的方法,提取此网页中的图片地址,最后将所有的图片地址写入到一个文本文件,用sh脚本一次性批量下载

我就是这么干的,一次下载了1000+张图片

$str =file_get_contents('http://127.0.0.1/?page_id=29'); //此处地址是我本地wp环境的归档目录页面

$list = array(); //这里存放结果map

$c1 = preg_match_all('//', $str, $m1); //先取出所有a标签文本

for($i=0; $i

{ //对所有的a标签进行取属性

$c2 = preg_match_all('/(w+)s*=s*(?:(?:(["'])(.*?)(?=2))|([^/s]*))/', $m1[0][$i], $m2); //匹配出所有的属性

for($j=0; $j

{ //将匹配完的结果进行结构重组

$list[$i][$m2[1][$j]] = !empty($m2[4][$j]) ? $m2[4][$j] : $m2[3][$j];

}

}

foreach($list as $list=>$sum)

{

if(preg_match('/http://127.0.0.1/?p=d+$/i',$sum['href']))//对结果进行筛选,筛选条件不唯一

{ $out= $sum['href']."
";

echo $out;

}

}

/*

输出结果为满足

http://127.0.0.1/?p=*

http://127.0.0.1/?p=*

的地址列表*/

?>

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值