[color=brown][b]Snoopy是一个PHP类库,用来模仿Web浏览器的功能,能够获取网页内容和发送表单信息的功能。
下载地址:[url]http://sourceforge.net/projects/snoopy/files/[/url]
它的基本功能大概如下:
-> 抓取网页的内容
-> 抓取网页的文字(去掉HTML代码)
-> 抓取网页的超级链接
-> 支持代理服务器
-> 支持基本的用户/密码认证模式
-> 支持自定义User agent、Referer、Cookies和HTTP头内容
-> 支持浏览器专项,并能控制转向深度
-> 方便提交数据并且获得返回值
-> 支持跟踪HTML框架
-> 支持再转向时传递Cookies
它的功能很全,但是有的功能没有运用过。
写了一些常用的功能的例子,其他的运用到了再来补充。
1.取HTML内容[/b][/color]
[color=brown][b]2.取得纯文本内容[/b][/color]
[color=brown][b]3.取得表单字段内容[/b][/color]
[color=brown][b]4.自动登录[/b][/color]
[color=brown][b]
注:自动登录还未测试成功,但基本用法是这样的。
其余功能待续。。。
[/b][/color]
下载地址:[url]http://sourceforge.net/projects/snoopy/files/[/url]
它的基本功能大概如下:
-> 抓取网页的内容
-> 抓取网页的文字(去掉HTML代码)
-> 抓取网页的超级链接
-> 支持代理服务器
-> 支持基本的用户/密码认证模式
-> 支持自定义User agent、Referer、Cookies和HTTP头内容
-> 支持浏览器专项,并能控制转向深度
-> 方便提交数据并且获得返回值
-> 支持跟踪HTML框架
-> 支持再转向时传递Cookies
它的功能很全,但是有的功能没有运用过。
写了一些常用的功能的例子,其他的运用到了再来补充。
1.取HTML内容[/b][/color]
<?php
include './Snoopy/Snoopy.class.php'; // 根据本地路径 导入Snoopy类
$snoopy = new Snoopy(); // 实例化一个Snoopy对象
$snoopy->fetch("http://www.hao123.com/"); // 想要抓取的网页地址,这里就抓取hao123为实例
$line = $snoopy->results; // 通过results属性来获取内容
print_r($line); // 输出
[color=brown][b]2.取得纯文本内容[/b][/color]
include './Snoopy/Snoopy.class.php'; // 根据本地路径 导入Snoopy类
$snoopy = new Snoopy(); // 实例化一个Snoopy对象
$snoopy->fetchtext("http://www.hao123.com/"); // 想要抓取的网页地址,这里就抓取hao123为实例
$line = $snoopy->results; // 通过results属性来获取内容
print_r($line); // 输出
[color=brown][b]3.取得表单字段内容[/b][/color]
include './Snoopy/Snoopy.class.php'; // 根据本地路径 导入Snoopy类
$snoopy = new Snoopy(); // 实例化一个Snoopy对象
$snoopy->fetch("http://bbs.blueidea.com/logging.php?action=login"); // 想要抓取的网页地址,这里就抓取blueidea的登录为实例
$line = $snoopy->results; // 通过results属性来获取内容
print_r($line); // 输出
[color=brown][b]4.自动登录[/b][/color]
$submit_url = "#";
$submit_vars['loginmode'] = 'normal';
$submit_vars['styleid'] = '1';
$submit_vars['name'] = '长虫的梅子';
$submit_vars['password'] = '*******';
$submit_vars['loginsubmit'] = "提 交";
$snoopy->submit($submit_url, $submit_vars); // 用submit方法来实现登录
print_r($snoopy->results);
[color=brown][b]
注:自动登录还未测试成功,但基本用法是这样的。
其余功能待续。。。
[/b][/color]