这个函数的功能就是把一段url的域名、路径、文件名等等用数组返回,通过数组的索引访问。
这个函数的核心是一段正则表达式,这段正则表达主要参考了微软的脚本文档。
注释的内容较多,所以各个部分我就不一一说明了。这个函数主要是为了另外的一个功能"通过cookie控制页面跳转"而开发的。下一篇博文,我就会详细介绍。并且附上完整的示例下载。
/******************************************************************** ** **比较通用的正则表达式,捕获url各个部分。 **注意各部分基本上都包含了相应的符号,例如端口号如果捕获成功,那就是':80' **函数返回一个正则表达式捕获数组。 **注意,现在获得的是一个数组,所以需要通过arr[i]的方式引用。 **正则表达式所有的匹配说明::......... **$0 **整个url本身。如果$0==null,那就是我的正则有意外,未捕获的可能。 **有一种未捕获的情况已经被发现,那就是域名后面没有以'/'结尾,如:'http://localhost' **但是经过我的测试,IE和firefox会自动把域名后面加上'/'的。 **$1-$4 协议,域名,端口号,还有最重要的路径path! **$5-$7 文件名,锚点(#top),query参数(?id=55) ** *********************************************************************/ function UrlRegEx(url) { //如果加上/g参数,那么只返回$0匹配。也就是说arr.length = 0 var re = /(/w+):([^/:|//]+)(/:/d*)?(.*//)([^#|/?|/n]+)?(#.*)?(/?.*)?/i; //re.exec(url); var arr = url.match(re); return arr; } //--------示例代码: function getPath() { return UrlRegEx(location.href)[4]; }
二、下面一个函数是获取URL中的主域:
<SCRIPT LANGUAGE="javascript">
<!--
url = "http://club.mil.news.sohu.com/r-shilin-1969040-192/a.php?cid=88";
var domain = UrlRegEx(url);
document.write(domain);
function UrlRegEx(url){
var patt = /[/w-]+/.(com|net|org|gov|cc|biz|info|cn)(/.(cn|hk))*/;
var arr = url.match(patt);
if(arr.length > 0) return arr[0];
else return false;
}
//-->
</SCRIPT>