php 过滤url_php用正则表达式匹配URL的简单方法

在PHP的官网上看到的parse_url()函数的替代方案。结果和parse_url()函数差不多,是使用正则实现的。URI 是 Web上可用的每种资源 - HTML文档、图像、视频片段、程序等 - 由一个通用资源标志符(Uniform Resource Identifier, 简称"URI")进行定位。 对象分组:

^(([^:/?#]+):)?(//([^/?#]*))?([^?#]*)(\?([^#]*))?(#(.*))?

12            3  4

测试代码如下:

$search = '~^(([^:/?#]+):)?(//([^/?#]*))?([^?#]*)(\?([^#]*))?(#(.*))?~i';

$url = 'https://www.jb51.net/pub/ietf/uri/#Gonn';

$url = trim($url);

preg_match_all($search, $url ,$rr);

printf("

输出URL数据为:

%s
\n",var_export( $rr ,TRUE));

/*

各分组如下

$1 = http:

$2 = http

$3 = //www.nowamagic.net

$4 = www.nowamagic.net

$5 = /pub/ietf/uri/

$6 =

$7 =

$8 = #Gonn

$9 = Gonn

*/

?>

上面的正则表达式可以获取URL中的任何一部分,下面的代码则简单一些:

// 从 URL 中取得主机名

preg_match("/^(http:\/\/)?([^\/]+)/i", "https://www.jb51.net/index.html", $matches);

$host = $matches[2];

// 从主机名中取得后面两段

preg_match("/[^\.\/]+\.[^\.\/]+$/", $host, $matches);

echo "domain name is: {$matches[0]}\n";

?>

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值