JS的正则详解

  正则表达式使用详解


<script type=text/javascript>
</script>

<script src="http://pagead2.googlesyndication.com/pagead/show_ads.js" type=text/javascript></script>

正则表达式使用详解
简介
简单的说, 正则表达式是一种可以用于模式匹配和替换的强有力的工具。其作用如下:
测试字符串的某个模式。例如,可以对一个输入字符串进行测试,看在该字符串是否存在一个电话号码模式或一个信用卡号码模式。这称为数据有效性验证。
替换文本。可以在文档中使用一个 正则表达式来标识特定文字,然后可以全部将其删除,或者替换为别的文字。
根据模式匹配从字符串中提取一个子字符串。可以用来在文本或输入字段中查找特定文字。
基本语法
在对 正则表达式的功能和作用有了初步的了解之后,我们就来具体看一下 正则表达式的语法格式。
正则表达式的形式一般如下:  
/love/  其中位于“/”定界符之间的部分就是将要在目标对象中进行匹配的模式。用户只要把希望查找匹配对象的模式内容放入“/”定界符之间即可。为了能够使用户更加灵活的定制模式内容, 正则表达式提供了专门的“元字符”。所谓元字符就是指那些在 正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。
较为常用的元字符包括: “+”, “*”,以及 “?”。
“+”元字符规定其前导字符必须在目标对象中连续出现一次或多次。
“*”元字符规定其前导字符必须在目标对象中出现零次或连续多次。
“?”元字符规定其前导对象必须在目标对象中连续出现零次或一次。
下面,就让我们来看一下 正则表达式元字符的具体应用。
/fo+/  因为上述 正则表达式中包含“+”元字符,表示可以与目标对象中的 “fool”, “fo”, 或者 “football”等在字母f后面连续出现一个或多个字母o的字符串相匹配。
/eg*/  因为上述 正则表达式中包含“*”元字符,表示可以与目标对象中的 “easy”, “ego”, 或者 “egg”等在字母e后面连续出现零个或多个字母g的字符串相匹配。
/Wil?/  因为上述 正则表达式中包含“?”元字符,表示可以与目标对象中的 “Win”, 或者“Wilson”,等在字母i后面连续出现零个或一个字母l的字符串相匹配。
有时候不知道要匹配多少字符。为了能适应这种不确定性, 正则表达式支持限定符的概念。这些限定符可以指定 正则表达式的一个给定组件必须要出现多少次才能满足匹配。
{n} n 是一个非负整数。匹配确定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的两个 o。
{n,} n 是一个非负整数。至少匹配 n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。
{n,m} m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,"o{1,3}" 将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o?'。请注意在逗号和两个数之间不能有空格。
除了元字符之外,用户还可以精确指定模式在匹配对象中出现的频率。例如,/jim {2,6}/ 上述 正则表达式规定字符m可以在匹配对象中连续出现2-6次,因此,上述 正则表达式可以同jimmy或jimmmmmy等字符串相匹配。
在对如何使用 正则表达式有了初步了解之后,我们来看一下其它几个重要的元字符的使用方式。
代码
   1. /s:用于匹配单个空格符,包括tab键和换行符;   
   2. /S:用于匹配除单个空格符之外的所有字符;   
   3. /d:用于匹配从0到9的数字;   
   4. /w:用于匹配字母,数字或下划线字符;   
   5. /W:用于匹配所有与/w不匹配的字符;   
   6. . :用于匹配除换行符之外的所有字符。   

(说明:我们可以把/s和/S以及/w和/W看作互为逆运算)
下面,我们就通过实例看一下如何在 正则表达式中使用上述元字符。
//s+/ 上述 正则表达式可以用于匹配目标对象中的一个或多个空格字符。
//d000/ 如果我们手中有一份复杂的财务报表,那么我们可以通过上述 正则表达式轻而易举的查找到所有总额达千元的款项。
除了我们以上所介绍的元字符之外, 正则表达式中还具有另外一种较为独特的专用字符,即定位符。定位符用于规定匹配模式在目标对象中的出现位置。 较为常用的定位符包括: “^”, “$”, “/b” 以及 “/B”。
代码
   1. “^”定位符规定匹配模式必须出现在目标字符串的开头  
   2. “$”定位符规定匹配模式必须出现在目标对象的结尾  
   3. “/b”定位符规定匹配模式必须出现在目标字符串的开头或结尾的两个边界之一  
   4. “/B”定位符则规定匹配对象必须位于目标字符串的开头和结尾两个边界之内,  
   5.       即匹配对象既不能作为目标字符串的开头,也不能作为目标字符串的结尾。  

同样,我们也可以把“^”和“$”以及“/b”和“/B”看作是互为逆运算的两组定位符。举例来说: /^hell/ 因为上述 正则表达式中包含“^”定位符,所以可以与目标对象中以 “hell”, “hello”或“hellhound”开头的字符串相匹配。 /ar$/ 因为上述 正则表达式中包含“$”定位符,所以可以与目标对象中以 “car”, “bar”或 “ar” 结尾的字符串相匹配。 //bbom/ 因为上述 正则表达式模式以“/b”定位符开头,所以可以与目标对象中以 “bomb”, 或 “bom”开头的字符串相匹配。/man/b/ 因为上述 正则表达式模式以“/b”定位符结尾,所以可以与目标对象中以 “human”, “woman”或 “man”结尾的字符串相匹配。
为了能够方便用户更加灵活的设定匹配模式, 正则表达式允许使用者在匹配模式中指定某一个范围而不局限于具体的字符。例如:
代码
   1. /[A-Z]/  上述 正则表达式将会与从A到Z范围内任何一个大写字母相匹配。  
   2. /[a-z]/  上述 正则表达式将会与从a到z范围内任何一个小写字母相匹配。   
   3. /[0-9]/  上述 正则表达式将会与从0到9范围内任何一个数字相匹配。   
   4. /([a-z][A-Z][0-9])+/ 上述 正则表达式将会与任何由字母和数字组成的字符串,如 “aB0” 等相匹配。  

这里需要提醒用户注意的一点就是可以在 正则表达式中使用 “()” 把字符串组合在一起。“()”符号包含的内容必须同时出现在目标对象中。因此,上述 正则表达式将无法与诸如 “abc”等的字符串匹配,因为“abc”中的最后一个字符为字母而非数字。
如果我们希望在 正则表达式中实现类似编程逻辑中的“或”运算,在多个不同的模式中任选一个进行匹配的话,可以使用管道符 “|”。例如:/to|too|2/ 上述 正则表达式将会与目标对象中的 “to”, “too”, 或 “2” 相匹配。
正则表达式中还有一个较为常用的运算符,即否定符 “[^]”。与我们前文所介绍的定位符 “^” 不同,否定符 “[^]”规定目标对象中不能存在模式中所规定的字符串。例如:/[^A-C]/ 上述字符串将会与目标对象中除A,B,和C之外的任何字符相匹配。一般来说,当“^”出现在 “[]”内时就被视做否定运算符;而当“^”位于“[]”之外,或没有“[]”时,则应当被视做定位符。
最后,当用户需要在 正则表达式的模式中加入元字符,并查找其匹配对象时,可以使用转义符“/”。例如:/Th/*/  上述 正则表达式将会与目标对象中的“Th*”而非“The”等相匹配。
在构造 正则表达式之后,就可以象数学表达式一样来求值,也就是说,可以从左至右并按照一个优先级顺序来求值。优先级如下:
代码
   1. 1./ 转义符  
   2. 2.(), (?, (?=), [] 圆括号和方括号  
   3. 3.*, +, ?, {n}, {n,}, {n,m} 限定符  
   4. 4.^, $, /anymetacharacter 位置和顺序  
   5. 5.|“或”操作  
使用实例
在JavaScript 1.2中带有一个功能强大的RegExp()对象,可以用来进行 正则表达式的匹配操作。其中的test()方法可以检验目标对象中是否包含匹配模式,并相应的返回true或false。
我们可以使用JavaScript编写以下脚本,验证用户输入的邮件地址的有效性。
代码
 
正则表达式对象(Javascript)
<script type="text/javascript"> </script><script src="http://pagead2.googlesyndication.com/pagead/show_ads.js" type="text/javascript"></script>
off
描述
保存 正则表达式模式。
语法 1
var regularexpression = / pattern /[ switch]
语法 2
var regularexpression = new RegExp(" pattern ",[ " switch "] ) 正则表达式对象语法有以下部分:
部分描述
pattern必需的。要使用的正则表达式模式。如果使用语法 1,用 "/" 字符分隔模式。如果用语法 2,用引号将模式引起来。
switch可选项。如果使用语法 2 要用引号将 switch 引起来。可选的开关选项有:
  • i (忽略大小写)
  • g (全文查找出现的所有 pattern
  • gi (全文查找、忽略大小写)
说明
正则表达式对象保存用于查找字符串中的字符组合时的模式。创建 正则表达式对象后,或者它被传递给字符串方法,或者字符串被传递给一个 正则表达式方法。有关最近进行查找的信息被保存在 RegExp 对象中。当预先知道查找字符串时用语法 1。当查找字符串经常变动或不知道时用语法 2,比如由用户输入得到的字符串。
在使用前 pattern 参数被编译为内部格式。对语法 1 来说, pattern 在该脚本被装载时被编译。对语法 2 来说, pattern 在使用前,或调用 compile 方法时被编译。
方法
compile 方法
描述
把一个 正则表达式编译为内部格式。
语法
rgexp. compile( pattern ) compile 方法的语法组成部分如下:
部分描述
rgexp必需的。正则表达式对象。 可以是变量名或文字。
pattern必需的。字符串表达式,它包含要被编译的正则表达式模式。
说明
compile 方法把 pattern 转换为内部的格式,从而执行得更快。例如,这使得可以在循环中更有效地使用 正则表达式。下面的例子举例说明了 compile 方法的用法:
function CompileDemo()
{
  var s = "AaBbCcDdEeFfGgHhIiJjKkLlMmNnOoPp"
                                  // 只为大写字母创建正则表达式。
  var r = new RegExp("[A-Z]", "g");
  var a = s.match(r)        // 查找匹配。
  document.write(a);
                                  // 只为小写字母编译正则表达式。
  r.compile("[a-z]", "g");
  var a = s.match(r)        // 查找匹配。
  document.write(a);
}

exec 方法
描述
在指定字符串中运行查找来获得匹配。
语法
rgexp. exec( str ) exec 方法的语法组成部分如下:
部分描述
rgexp必需的。正则表达式 对象。可以是变量名或文字。
str必需的。要执行查找的字符串。
说明
exec 方法查找的结果被放在一个数组中。 如果 exec 方法没有找到匹配,则它返回 null。如果它找到一个或多个匹配,则 exec 方法返回一个数组,并且更新 RegExp 对象,来反映查找结果。
下面的例子举例说明了 exec 方法的用法:
function ExecDemo()
{
  var s = "AaBbCcDdEeFfGgHhIiJjKkLlMmNnOoPp"
  var r = new RegExp("g", "i");
  var a = r.exec(s);
  document.write(a);
  r.compile("g");
  var a = r.exec(s);
  document.write(a);
}

test 方法描述
返回一个 Boolean 值,它指出在被查找的字符串中是否存在模式。
语法
rgexp. test( str ) test 方法的语法组成部分如下:
部分描述
rgexp必需的。正则表达式 对象。可以是变量名或文字。
str必需的。要在其上测试查找的字符串。
说明
test 方法检查在字符串中是否存在一个模式,如果存在则返回 true,否则就返回 falseRegExp 对象不由 test 方法来修改。
下面的例子举例说明了 test 方法的用法:
function TestDemo(re, s)
{
  var s1;
  // 检查字符串是否存在正则表达式。
  if (re.test(s))
    s1 = " contains ";
  else
    s1 = " does not contain ";
  // 获得正则表达式自己的文本。
  return(s + s1 + re.source);
}



属性

lastIndex 属性 描述
指定索引,下一个匹配从该索引处开始。
语法
rgexp. lastIndex [= index] lastIndex 属性的语法组成部分如下:
部分描述
rgexp必需的。正则表达式 对象。可以是变量名或文字。
index索引,下一个匹配从该索引处开始。
说明
lastIndex 属性被 exec 方法、以及 String 对象的 matchreplace、和 split 方法修改。下面的规则应用于 lastIndex 的值:
  • 如果 lastIndex 大于字符串的长度,则 testexec 方法失败,并且 lastIndex 被设置为零。
  • 如果 lastIndex 等于字符串的长度,且模式与空字符串匹配,则正则表达式匹配。否则匹配失败,并且 lastIndex 被重置为零。
  • 否则,lastIndex 被设置为紧接最近的匹配的下一个位置。



source 属性
描述
返回 正则表达式模式的文本的复本。只读。
语法
rgexp. source rgexp 参数是 正则对象。它可以是变量名或文字。
下面的例子举例说明了 source 属性的用法:
function SourceDemo(re, s)
{
  var s1;
  // 测试字符串中是否存在正则表达式。
  if (re.test(s))
    s1 = " contains ";
  else
    s1 = " does not contain ";
  // 获得正则表达式自己的文本。
  return(s + s1 + re.source);
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值