类似于这样的效果:
首先我们下载Snoopy这个类。
然后我们新建一个php文件(collection.php)写如下代码:
通过开发者工具我们可以看到文章主要内容在rich_media_content这个类里面,并且此类在页面中是唯一的元素。
<?
header("Content-type: text/html; charset=utf-8");
include("Snoopy.class.php");
$sn =$_GET['sn'];
$url = $sn;
$pos = strpos($url,'mp.weixin.qq.com');//指定url规则,只抓取微信文章
if ($pos == false) {
echo '1';
exit();//判断url路径是否正确,不正确返回一个数字1表示。
} else {
$snoopy = new Snoopy; //实例化Snoopy这个类
$snoopy->fetch($url); //获取所有内容
$contents=$snoopy->results;
preg_match('|<div class="rich_media_content " id="js_content">(.*?)<\/div>|si',$contents,$m);//设置需要抓取页面中那块内容
$m[1] = str_replace("data-src", "src",$m[1]);
echo $m[1];
}
?>
具体效果请看:微信图文抓取