php 通用采集入库程序

采集 用到的知识点

file_get_contents()

preg_match_all()

preg_match()

preg_replace()

正则表达式、正则修正符的用法

 

ls.php文件内容:

$con=file_get_contents("url");

$preg="##iUs"  //正则表达式

preg_match_all($preg,$con,$arr);

foreach($arr[1] as $id=>$v){

       echo $v."  ".$arr[2][$id]."<br>";

}

vi.php内容

$con=file_get_content("url2");

$preg="#<title>(.*)</title>#iUs";

echo zz("#<title>(.*)</title>#iUs",$con);

echo zz("#<!--正文-->#")

preg_match($preg,$con,$arr);

function zz($preg,$con,$num=1){

preg_match($preg,$con,$arr);

return $arr[$num];

}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值