snoopy php 动态js,php基于Snoopy解析网页html的方法

本文介绍了如何利用PHP的Snoopy库抓取和解析网页HTML,通过DOMDocument和DOMXPath查找特定节点,提取并保存图片。示例代码展示了从指定网站抓取并保存图片的过程,帮助开发者了解网络爬虫的基本操作。
摘要由CSDN通过智能技术生成

本文实例讲述了php基于Snoopy解析网页html的方法。分享给大家供大家参考。具体实现方法如下:

set_time_limit(0);

$user = array(‘20517‘, ‘20518‘);

header("content-Type: text/html; charset=utf-8");

require_once ‘./Snoopy.php‘;

$snoopy = new Snoopy();

//$uri = ‘http://www.juzimi.com/meitumeiju‘;

$uri = ‘http://www.juzimi.com/meitumeiju?page=1‘;

$snoopy->fetch($uri);

$con = $snoopy->getResults();

$doc = new DOMDocument();

$doc->loadHTML($con);

/* make a result array ... */

$result = [];

/* go through all nodes which have class="baby" ... */

$i = 0;

foreach( ( new DOMXPath( $doc ) )->query( ‘//*[@id="bdshare"]‘ ) as $element ) {

$row = $doc->saveHTML($element);

$start = stripos($row, ‘{‘);

$end = stripos($row, ‘}‘);

$len = $end - $start + 1;

$json = substr($row, $start, $len);

$json = str_replace("‘", ‘"‘, $json);

$obj = json_decode($json);

$pic = $obj->pic;

$desc = $obj->desc;

$filename = ‘/Uploads/meiju/card‘ . date(‘ymdhis‘) . $i . ‘.png‘;

$file = ‘/alidata/www/test‘ . $filename;

$image = file_get_contents($pic);

file_put_contents($file, $image);

}

希望本文所述对大家的php程序设计有所帮助。

原文:http://www.jb51.net/article/69249.htm

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值