思路分析:
1.使用fopen函数打开网站资源
2.使用fgets函数每行读取
3.使用正则匹配路径
4.路径处理
5.使用处理好的路径file_get_contents进入图片目标地址
6.使用fwrite()写入文件
7.主要是将写入的文件名改变为原本的后缀
/*可以使用正则匹配主网页中的其他网页链接,理论上可以扒取整站图片,处理图片也可以使用gd库拷贝,有个取巧的方法,查看目标网站图片储存的目录与文件名是否有规律*/
这里只写了一点从网页中提取图片路径与其他网页的链接路径:
$arr=array();
$arrhref=array();
$str=fopen("目标网页地址",'r');
while($str1=fgets($str)){
$reg='/src=(\'|")(.){1,}(\.jpg|\.png|\.jpeg)(\'|")/';
$reg1='/href=(\'|")(.){1,}(\.php|\.html)(\'|")/';
preg_match($reg, $str1,$arr1);
preg_match($reg1, $str1,$arr2);
if(!empty($arr1))
{
$arr[]=$arr1[0];
}
if(!empty($arr2))
{
$arrhref[]=$arr2[0];
}
}
echo "<pre>";
print_r($arr);
print_r($arrhref);