php站内搜索跟站外搜索,采集百度的搜索结果,可以用到站内搜索,节省资源

/**

* 采集百度的搜索结果,可以用到站内搜索,节省资源

* 分页部分就没有处理了,需在函数外处理

*

* @author Aboc QQ:9986584

*/

function searchBaidu($keyword,$page=0){

if(empty($keyword))return false;

$keyword = urlencode($keyword);

if($page>76)$page=76;

$content = file_get_contents("http://www.baidu.com/s?wd=".$keyword.'&pn='.$page);

//echo $content;

//如果找不到

if(strpos($content,'抱歉,没有找到与“')!==false)return false;

preg_match('/百度一下,找到相关网页(.*)篇,用时/',$content,$a);

//搜索结果数

$num = str_replace(array('约',','),'',$a[1]);

$page = ceil($num)/10;

//echo $num;

//采集到的标题

preg_match_all('/(\(.+?)\\\
)/',$content,$b);

//print_r($b[2]);

$title = $b[2];

//采网址

preg_match_all('/(\)/',$content,$c);

//print_r($c);

$href = $c[3];

//采内容

preg_match_all('/(\(.+?)\
)/',$content,$d);

//print_r($d);

$detail = $d[2];

$end = array();

$end[0] = array('num'=>ceil($num),'page'=>$page);

foreach( $title as $key=>$row ){

$end[1][$key]['title']=$title[$key];

$end[1][$key]['href']=$href[$key];

$end[1][$key]['detail']=$detail[$key];

}

return $end;

}

/**

* 使用

*/

if( $search = searchBaidu('www.yiwuku.com') )

print_r($search);

else

echo '没有找到';

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值