前些日子跟别的公司合作了一个短信投票业务,对方需要把用户上行发送到我们平台,我这需要receive他的数据,然后他需要每发送一个数据我这边判断正确的话就输出一个内容让其抓取。之前只做过接收数据并处理,至于抓取没做过。在网上找了好多关于相关的文档。不过感觉都挺麻烦,最后就直接删除了很多功能代码,不过可以完成自己需要的功能了!
我说下我做的几个简单步骤:
1.可以新建一个test页面,如test.php
<
html
>
< head >
< title > PHP 网页抓取测试 </ title >
</ head >
< body >
<? php echo ' <p>Hello World!</p> ' ; ?>
</ body >
</ html >
< head >
< title > PHP 网页抓取测试 </ title >
</ head >
< body >
<? php echo ' <p>Hello World!</p> ' ; ?>
</ body >
</ html >
2.新建抓取页面,如zhuaqu.php,代码如下:
<
html
>
< head >
< title > 实用抓取网页内容测试 </ title >
< meta http - equiv = " Content-Type " content = " text/html; charset=UTF-8 " >
</ head >
< body >
<? php
$url = ' http://localhost/test.php ' ; // 测试本地网页
# $url = 'http://www.myenjoylife.cn/index.php'; //抓取www.myenjoylife.cn首页内容
$lines_array = file ( $url );
$lines_string = implode ( '' , $lines_array );
eregi ( " (.*) " , $lines_string , $head );
echo $head [ 0 ];
?>
</ body >
</ html >
< head >
< title > 实用抓取网页内容测试 </ title >
< meta http - equiv = " Content-Type " content = " text/html; charset=UTF-8 " >
</ head >
< body >
<? php
$url = ' http://localhost/test.php ' ; // 测试本地网页
# $url = 'http://www.myenjoylife.cn/index.php'; //抓取www.myenjoylife.cn首页内容
$lines_array = file ( $url );
$lines_string = implode ( '' , $lines_array );
eregi ( " (.*) " , $lines_string , $head );
echo $head [ 0 ];
?>
</ body >
</ html >
3. 完成,就这么简单,如果你想抓取别的网页内容,只要改$url参数变量值,像抓取http://www.myenjoylife.cn的内容改成这个网址就OK啦!