js通用函数，通过正则表达式获取url的各个部分

最新推荐文章于 2023-10-20 10:47:17 发布

ShaoWenJing

最新推荐文章于 2023-10-20 10:47:17 发布

阅读量1.5k

点赞数

分类专栏： JS 文章标签：正则表达式 url function domain javascript firefox

JS 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

这个函数的功能就是把一段url的域名、路径、文件名等等用数组返回，通过数组的索引访问。

这个函数的核心是一段正则表达式，这段正则表达主要参考了微软的脚本文档。

注释的内容较多，所以各个部分我就不一一说明了。这个函数主要是为了另外的一个功能"通过cookie控制页面跳转"而开发的。下一篇博文，我就会详细介绍。并且附上完整的示例下载。

/********************************************************************
**
**比较通用的正则表达式，捕获url各个部分。
**注意各部分基本上都包含了相应的符号，例如端口号如果捕获成功，那就是':80'
**函数返回一个正则表达式捕获数组。
**注意，现在获得的是一个数组，所以需要通过arr[i]的方式引用。
**正则表达式所有的匹配说明::.........
**$0
**整个url本身。如果$0==null，那就是我的正则有意外，未捕获的可能。
**有一种未捕获的情况已经被发现，那就是域名后面没有以'/'结尾，如：'http://localhost'
**但是经过我的测试，IE和firefox会自动把域名后面加上'/'的。
**$1-$4  协议，域名，端口号，还有最重要的路径path！
**$5-$7  文件名，锚点(#top)，query参数(?id=55)
**
*********************************************************************/ 
 
 function UrlRegEx(url)
 { 
  //如果加上/g参数，那么只返回$0匹配。也就是说arr.length = 0
  var re = /(/w+):([^/:|//]+)(/:/d*)?(.*//)([^#|/?|/n]+)?(#.*)?(/?.*)?/i;
  //re.exec(url);
  var arr = url.match(re);
  return arr;
 
 }
//--------示例代码：
 function getPath()
 {
  return UrlRegEx(location.href)[4]; 
 }

二、下面一个函数是获取URL中的主域：

<SCRIPT LANGUAGE="javascript">
<!--
url = "http://club.mil.news.sohu.com/r-shilin-1969040-192/a.php?cid=88";
var domain = UrlRegEx(url);
document.write(domain);

function UrlRegEx(url){ 

 var patt = /[/w-]+/.(com|net|org|gov|cc|biz|info|cn)(/.(cn|hk))*/;
 var arr = url.match(patt);
 if(arr.length > 0) return arr[0];
 else return false;
}
//-->
</SCRIPT>