php采集器原理,PHP采集原理

很多时间我们的信息都是来自其他网站,这样我们复制,粘贴,发布很麻烦,当然你不可以把他们的信息批量复制过来,这个时候就需要采集了~~

采集就是使用file_get_contents函数和正则的使用

先贴上一段代码

无标题文档

?>

[/php]

[php]

无标题文档

function GetInfo($preg,$con,$num=1)

{

preg_match($preg,$con,$arr);

$arr[$num]=str_replace("src=\"/upFile/","src=\"http://nitnews.nyist.net/upFile/",$arr[$num]);

return $arr[$num];

}

$url=$_GET[‘url’];

$content=file_get_contents($url);

$pr="@

(.*)

@iUs";

echo "文章标题是:".GetInfo($pr,$content);

$con="#(.*)#iUs";

echo "文章内容是:".GetInfo($con,$content);

?>

[/php]

这个是我读取我们学校新闻网的一个采集程序,其中原理很简单,如果需要存入数据库~~~那个就简单了,只用在显示的地方写存入数据库代码即可~

要点:空格和标点都不能少!如果没有采集到那么请检查你的匹配规则

附:采集很简单,要理解它的原理就可以了~~以后再批量发布信息就不怕了~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值