php正则匹配文章中的远程图片地址并下载图片到本地

今天在做一个简单的采集程序需要下载对方网站内容,然后把内容中的图片再保存在本地服务器上,下面我来给各位同介绍我的具体操作方法,下载图片主要用到了file_get_contents 函数,具体方法如下。

这里我们使用php的正则表达式来实现


$content = '这里是文章内容,这里插入一张图片测试 <img src="http://www.php1.cn/imgupload/201509/0904011721db04fb16_75_0.jpg">';
$content = stripslashes ( $content );
$img_array = array ();
// 匹配所有远程图片
preg_match_all ( "/(src|SRC)=["|'| ]{0,}(http://(.*).(gif|jpg|jpeg|bmp|png))/isU", $content, $img_array );
// 匹配出来的不重复图片
$img_array = array_unique ( $img_array [2] );
print_r($img_array);

上面就将远程图片给匹配出来了,我们需要将其保持到本地。这里需要注意两点:

1.图片保存路径(图片存储目录)

2.实际访问图片地址

下面是完整实例:(你可以保存到本地服务器修改相应地方进行测试)


<!DOCTYPE HTML>

<html>

<head>

<meta charset="UTF-8">

<title>php保存远程图片到本地,php正则匹配文章中的图片地址</title>

</head>

<body>

<?php

//保存文章中远程图片到本地

//作者:yanue;

// 文件保存目录路径(请更换为你自己的路径, 你可以echo一下)

$save_path = $_SERVER ['DOCUMENT_ROOT'] . 'swfupload/attached/';

// 文件保存目录URL

$save_url = '/swfupload/attached/';

$save_path = realpath ( $save_path ) . '/';

// 图片存储目录

$imgPath = $save_path . date ( "Ymd" );

$imgUrl = $save_url . date ( "Ymd" );

// 创建文件夹

if (! is_dir ( $imgPath )) {

 @mkdir ( $imgPath, 0777 );

}

$content = '这里是文章内容,这里插入一张图片测试 <img src="
http://www.php1.cn/imgupload/201509/0904011721db04fb16_75_0.jpg">'
;

$content = stripslashes ( $content );

$img_array = array ();

// 匹配所有远程图片

preg_match_all ( "/(src|SRC)=["|'| ]{0,}(
http://(.*).(gif|jpg|jpeg|bmp|png))/isU
", $content, $img_array );

// 匹配出来的不重复图片

$img_array = array_unique ( $img_array [2] );

print_r($img_array);

// 时间无限制

set_time_limit ( 0 );

foreach ( $img_array as $key => $value ) {

 $value = trim ( $value );

 // 读取远程图片

 $get_file = @file_get_contents ( $value );

 // 保存到本地图片名称

 $imgname = date ( "YmdHis" ) . '_' . rand ( 10000, 99999 ) . "." . substr ( $value, - 3, 3 );

 // 保存到本地的实际文件地址(包含路径和名称)

 $fileName = $imgPath . '/' . $imgname;

 // 实际访问的地址

 $fileurl = $imgUrl . "/" . $imgname;

 // 文件写入

 if ($get_file) {

  $fp = @fopen ( $fileName, "w" );

  @fwrite ( $fp, $get_file );

  @fclose ( $fp );

 }

 // 替换原来的图片地址

 $content = ereg_replace ( $value, $fileurl, $content );

}

echo $content;

?>

</body>

</html>



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值