OX01: Web Speder 入门



最近雨下得厉害,闲的百无聊赖,遂萌生码码最近看的《Webbots、Spiders 和 Screen Scrapers》的想法~~~


一下正文:

----------------------------------------------------------------------------------------------------------------------------------------------------------------

由于,初次接触PHP。不知配置的PHP的生猛,一连上网找了许多的资料。几经测试都是失败,后来试了wamp。(慕课上有教程的)nice!终于可以了!那个激动得!

还要说说本书含的LIB库。先从本书官网上下载该库,解压到任意路径。记住!



0x01  LIB_http定义了以下的默认变量


可以在源代码中修改

define("WEBBOTS_NAME","Test Webbot");
define("CURL_TIMEOUT",25);
define("COOKIE_FILE","c:\cookie.txt");


事实上,这个库只是curl的封装,更便于使用。



0x02 使用LIB_parse,获取特定html标签

<?php
include("D:\wamp\bin\php\php5.5.12\include\LIB_parse.php");
include("D:\wamp\bin\php\php5.5.12\include\LIB_http.php");

$web_page = http_get($target = "www.baidu.com",$referer ="");

$meta_tag_array = parse_array($web_page['FILE'],"<img",">");

for($xx = 0; $xx<count($meta_tag_array);$xx++)
{
	echo $meta_tag_array[$xx]."\n";
	$name = get_attribute($meta_tag_array[$xx],$attribute="src");
	echo $name ."\n";
}
?>


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值