snoopy php 动态js,php基于Snoopy解析网页html的方法

盲点大侠

于 2021-03-25 18:19:47 发布

阅读量142

点赞数

文章标签： snoopy php 动态js

本文介绍了如何利用PHP的Snoopy库抓取和解析网页HTML，通过DOMDocument和DOMXPath查找特定节点，提取并保存图片。示例代码展示了从指定网站抓取并保存图片的过程，帮助开发者了解网络爬虫的基本操作。

摘要由CSDN通过智能技术生成

本文实例讲述了php基于Snoopy解析网页html的方法。分享给大家供大家参考。具体实现方法如下：

set_time_limit(0);

$user = array(‘20517‘, ‘20518‘);

header("content-Type: text/html; charset=utf-8");

require_once ‘./Snoopy.php‘;

$snoopy = new Snoopy();

//$uri = ‘http://www.juzimi.com/meitumeiju‘;

$uri = ‘http://www.juzimi.com/meitumeiju?page=1‘;

$snoopy->fetch($uri);

$con = $snoopy->getResults();

$doc = new DOMDocument();

$doc->loadHTML($con);

/* make a result array ... */

$result = [];

/* go through all nodes which have class="baby" ... */

$i = 0;

foreach( ( new DOMXPath( $doc ) )->query( ‘//*[@id="bdshare"]‘ ) as $element ) {

$row = $doc->saveHTML($element);

$start = stripos($row, ‘{‘);

$end = stripos($row, ‘}‘);

$len = $end - $start + 1;

$json = substr($row, $start, $len);

$json = str_replace("‘", ‘"‘, $json);

$obj = json_decode($json);

$pic = $obj->pic;

$desc = $obj->desc;

$filename = ‘/Uploads/meiju/card‘ . date(‘ymdhis‘) . $i . ‘.png‘;

$file = ‘/alidata/www/test‘ . $filename;

$image = file_get_contents($pic);

file_put_contents($file, $image);

}

希望本文所述对大家的php程序设计有所帮助。

原文：http://www.jb51.net/article/69249.htm

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

盲点大侠

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

html网页内容抓取

03-26

NULL 博文链接：https://haroldxie.iteye.com/blog/1133877

php snoopy js,PHP使用Snoopy类实现页面抓取的方法

weixin_35224206的博客

03-18

190

本篇文章主要介绍PHP使用Snoopy类实现页面抓取的方法，感兴趣的朋友参考下，希望对大家有所帮助。本文实例讲述了php中Snoopy类用法，具体分析如下：这里演示了php中如何通过Snoopy抓取网页信息/*You need the snoopy.class.php fromhttp://snoopy.sourceforge.net/*/include("snoopy.class.php");$...

参与评论您还未登录，请先登录后发表或查看评论

php snoopy官网,php基于Snoopy解析网页html的方法

weixin_30952735的博客

03-10

127

set_time_limit(0);$user = array('20517', '20518');header("content-Type: text/html; charset=utf-8");require_once './Snoopy.php';$snoopy = new Snoopy();//$uri = 'http://www.juzimi.com/meitumeiju';$uri =...

snoopy php来提取网页中你要的信息

06-02

里面snoopy可以很方便的编写php来提取网页中你要的信息

php基于Snoopy解析网页html的方法

10-23

在进行网页解析之前，需要设置超时时间，以确保脚本有足够的时间来处理整个HTML文档。在PHP中，可以通过`set_time_limit(0);`来设置脚本执行的最大时间为无限制。此外，在脚本开始时设置正确的HTTP头信息也是非常...

PHP抓取网页、解析HTML常用的方法总结

10-24

本文将重点总结PHP在网页抓取和HTML解析方面常用的方法。首先，我们来探讨PHP实现网页抓取的方法。网页抓取主要是指从其他网站获取数据的过程，这些数据可能包括HTML、文本、图片等多种格式。以下是PHP中常见的几...

Snoopy.class.rar_Snoopy.class.php

09-22

8. **内容解析**：虽然Snoopy本身并不具备HTML解析能力，但可以与其他PHP解析库（如DOMDocument或SimpleXMLElement）结合使用，提取和解析网页中的特定数据。 9. **调试工具**：Snoopy提供了丰富的调试信息，如请求...

PHP中使用snoopy采集类进行数据抓取

逸尘的专栏

03-18

1945

include "Snoopy.class.php"; $snoopy = new Snoopy;$snoopy->proxy_host = "http://www.url.net"; $snoopy->proxy_port = "80";$snoopy->agent = "(compatible; MSIE 4.01; MSN 2.5; AOL 4.0; Windows 98)"; $snoopy

snoopy php 动态js,[爬虫]php 通过 ajax 与 file_get_contents， snoopy 都无法获取壹心理电台的动态页面...

weixin_39986060的博客

03-25

161

52014-12-23 01:52:08 +08:00设置referer和X-Requested-With即可成功获取了以下是测试返回值{"code": 0, "data": {"favnum": 398, "commentnum": 120, "speaker_id": 108, "is_home": true, "background": "http://image.xinli001.com/...

php采集审查元素,Python网络数据采集之审查元素

weixin_34410975的博客

03-11

459

普通的网络数据可使用get或post方法来采集得到，而有些网站源代码只能通过审查元素的方式才可以看到，本文介绍如何使用Python代码实现审查元素的网络数据采集方法。使用Python实现通过审查元素采集数据需要用到selenium库，具体实现步骤如下：官网下载selenium并安装，编写Python测试脚本。from selenium import webdriverbrowser = webdr...

PHP爬虫最全总结 -phpQuery，PHPcrawer，snoopy框架中文介绍

m0_37477061的博客

06-16

4447

1.几种常用的PHP爬虫框架对比1.1 phpQuery优势：类似jquery的强大搜索DOM的能力。 pq()是一个功能强大的搜索DOM的方法，跟jQuery的$()如出一辙，jQuery的选择器基本上都能使用在phpQuery上，只要把“.”变成“->”,Demo如下(对应我的github的Demo5)<?php require('phpQuery/phpQuery.php')...

php js代码,在php中运行js代码的方法

weixin_34268462的博客

03-09

3941

在php中运行js代码的方法发布时间：2020-04-11 13:59:32来源：亿速云阅读：238作者：小新今天小编给大家分享的是在php中运行js代码的方法，很多人都不太了解，今天小编为了让大家更加了解php中运行js代码的方法，所以给大家总结了以下内容，一起往下看吧。一定会有所收获的哦php可以运行js代码。在PHP中，HTML代码和JavaScript代码会被当成字符串，然后在浏览器中被解...

snoopy（强大的PHP采集类）详细介绍

笔记

05-03

1266

snoopy（强大的PHP采集类）详细介绍 lanfengye | 2012-08-02 | PHP | 阅读(792) 4 Snoopy是一个php类，用来模拟浏览器的功能，可以获取网页内容，发送表单，可以用来开发一些采集程序和小偷程序，本文章详细介绍snoopy的使用教程。 Snoopy的一些特点: 抓取网页的内容 fetch 抓取网页的文本内容

facebook数据采集——利用BigPipe技术和xpath解析数据

FootMan GO

07-02

7296

这篇文章主要是介绍两个技术，一个是网页前端加速BigPipe技术，另一个是html数据解析需要用到的xpath技术。

【教程】如何抓取动态网页内容

hong的专栏

05-15

4893

http://www.crifan.com/how_to_crawl_dynamic_webpage_content/ 背景很多时候，很多人，需要去抓取网页中某些特定内容。但是，除了之前介绍过的，想要提取某些，静态网页，中的特定内容，比如：【教程】抓取网并提取网页中所需要的信息之 Python版和【教程】抓取网并提取网页中所需要的

php设置文件类型content-type

weixin_30730151的博客

05-24

1615

在PHP中可以通过header函数来发送头信息，还可以设置文件的content-type，下面整理了一些常见文件类型对于的content-type值。//date 2015-06-22//定义编码header( 'Content-Type:text/html;charset=utf-8 ');//Atomheader('Content-type: application/atom+xml');...

解除劳动合同五大热点问题及裁员概述.ppt

09-14

解除劳动合同五大热点问题及裁员概述.ppt

暴风TV 43X-45X-50X-55X、43B2-50B2-55B2升级程序