php匹配url任意字符串,php正则表达式解析字符串里的所有URL地址

本文章给大家介绍在php正则表达式解析字符串里的所有URL地址实现代码,有需要了解学习的朋友可进入参考。

分享一个同事写的URL正则表达式,缺点不支持中文URL:

 代码如下复制代码

(http[s]{0,1}|ftp)://[a-zA-Z0-9\.\-] \.([a-zA-Z]{2,4})(:\d )?(/[a-zA-Z0-9\.\-~!@#$%^&* ?:_/=<>]*)?

下面介绍一个可以支持中文正则url

 代码如下复制代码
var regexp = new RegExp("(http[s]{0,1}|ftp)://[a-zA-Z0-9\.\-] \.([a-zA-Z]{2,4})(:\d )?(/[a-zA-Z0-9\.\-~!@#$%^&* ?:_/=<>]*)?", "gi");

var urls = textbox.value.match(regexp) || [];//textbox为文本框

console.log(urls);

实例

 代码如下复制代码

// $html        = the html on the page

// $current_url = the full url that the html came from (only needed for $repath)

// $repath      = converts ../ and / and // urls to full valid urls

function pageLinks($html, $current_url = "", $repath = false){

preg_match_all("/

$links = array();

if(isset($matches[2])){

$links = $matches[2];

}

if($repath && count($links) > 0 && strlen($current_url) > 0){

$pathi      = pathinfo($current_url);

$dir        = $pathi["dirname"];

$base       = parse_url($current_url);

$split_path = explode("/", $dir);

$url        = "";

foreach($links as $k => $link){

if(preg_match("/^../", $link)){

$total = substr_count($link, "../");

for($i = 0; $i < $total; $i ){

array_pop($split_path);

}

$url = implode("/", $split_path) . "/" . str_replace("../", "", $link);

}elseif(preg_match("/^///", $link)){

$url = $base["scheme"] . ":" . $link;

}elseif(preg_match("/^/|^.//", $link)){

$url = $base["scheme"] . "://" . $base["host"] . $link;

}elseif(preg_match("/^[a-zA-Z0-9]/", $link)){

if(preg_match("/^http/", $link)){

$url = $link;

}else{

$url       = $dir . "/" . $link;

}

}

$links[$k] = $url;

}

}

return $links;

}

header("content-type: text/plain");

$url = "http://www.jquerycn.cn";

$html = file_get_contents($url);

// Gets links from the page:

print_r(pageLinks($html));

// Gets links from the page and formats them to a full valid url:

print_r(pageLinks($html, $url, true));

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值