使用Snoopy类实现微信图文抓取功能

类似于这样的效果:
这里写图片描述
首先我们下载Snoopy这个类。
然后我们新建一个php文件(collection.php)写如下代码:
通过开发者工具我们可以看到文章主要内容在rich_media_content这个类里面,并且此类在页面中是唯一的元素。
这里写图片描述

<? 
header("Content-type: text/html; charset=utf-8");
include("Snoopy.class.php"); 
$sn =$_GET['sn'];
$url = $sn; 
$pos = strpos($url,'mp.weixin.qq.com');//指定url规则,只抓取微信文章
if ($pos == false) {
    echo '1'; 
    exit();//判断url路径是否正确,不正确返回一个数字1表示。
} else {
 $snoopy = new Snoopy; //实例化Snoopy这个类
$snoopy->fetch($url); //获取所有内容 
$contents=$snoopy->results;
preg_match('|<div class="rich_media_content " id="js_content">(.*?)<\/div>|si',$contents,$m);//设置需要抓取页面中那块内容
$m[1] = str_replace("data-src", "src",$m[1]);
echo $m[1];  
}
?> 

具体效果请看:微信图文抓取

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值