$url = $_REQUEST['url']; //要抓取的url
if(!$url){
$code = "{\"flag\":\"0\",\"msg\":\"url有误\"}";
echo $code;
return;
}
//创建抓取的文件夹
$date = md5($url); // 为防止每次url都创建新的文件夹导致路径不一样
$date = substr($date,0,10);
$dir = iconv("UTF-8", "GBK", '../'.$date);
if (!file_exists($dir)){
mkdir ($dir,0777,true);
}
$fh= file_get_contents($url);
//抓取网页图片
$dir = iconv("UTF-8", "GBK", '../'.$date.'/img');
if (!file_exists($dir)){
mkdir ($dir,0777,true);
}
$pattern="/<img.*?-src=[\'|\"](.*?(?:[\.gif|\.jpg]))[\'|\"].*?[\/]?>/"; //正常为<img.*?src=[\'|\"](.*?(?:[\.gif|\.jpg]))[\'|\"].*?[\/]?>为防止微信中的data-croporisrc扰乱图片所以在src前面加了“-”
preg_match_all($pattern,$fh,$match);
$imgdir = '../'.$date.&#
抓取微信公众号文章(抓取网页)
最新推荐文章于 2024-03-07 16:28:56 发布