phpcms相对路径链接内容采集修正

如 <a href="../../content.html">详情</a>含相对路径

collection.class.php

get_html(){

$url = real_url($ur);l

...

}

url_check(){

...

return real_url($ur);

}

get_url_lists(){

...

$out[2] = array_unique($out[2]);//会导致即便链接地址不同,但<a></a>之间内容相同的链接仅仅采集一项

...

}


/**
 * 带../的url转为不带../
 * @param string $url
 * @return string
 */
function reald_url($url){
    if($r_post = strripos($url,'../')){
        $url_suf = substr($url, $r_post+3);
        $url_pre = substr($url, 0, strpos($url, '../'));
        $num = substr_count($url,'../');
        $url_pre = strrev(preg_replace('/([a-z0-9\-]+\/)/', '', strrev($url_pre),$num));
        $url = $url_pre.$url_suf;
    }
    return $url;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值