javascript 正则表达式

最新推荐文章于 2024-07-19 12:58:53 发布

wyfh2010

最新推荐文章于 2024-07-19 12:58:53 发布

阅读量657

点赞数

文章标签： javascript 正则表达式 function 测试 idea 电话

经典JavaScript正则表达式--1

2010年06月20日星期日 14:04

匹配结尾的数字

如
30CAC0040 取出40
3SFASDF92 取出92

正则如下：/\d+$/g

统一空格个数

字符串内字符键有空格，但是空格的数量可能不一致，通过正则将空格的个数统一变为一个。

例如：蓝色理想

变成：蓝色理想

aobert的正则：

<script type="text/javascript"> 
 var str="蓝 色 理 想" 
 var reg=/\s+/g 
 str = str.replace(reg," ") 
 document.write(str) 
 </script>

判断字符串是不是由数字组成

这个正则比较简单，写了一个测试

<script type="text/javascript"> 
 function isDigit(str){ 
  var reg = /^\d*$/; 
  return reg.test(str); 
 } 
 var str = "7654321"; 
 document.write(isDigit(str)); 
 var str = "test"; 
 document.write(isDigit(str)); 
 </script>

电话号码正则

/^\d{3,4}-\d{7,8}(-\d{3,4})?$/

区号必填为3-4位的数字，区号之后用“-”与电话号码连接

^\d{3,4}-

电话号码为7-8位的数字

\d{7,8}

分机号码为3-4位的数字，非必填，但若填写则以“-”与电话号码相连接

(-\d{3,4})?

手机号码正则表达式

正则验证手机号，忽略前面的0，支持130-139，150-159。忽略前面0之后判断它是11位的。

cloeft的正则：

/^0*(13|15)\d{9}$/

^0*匹配掉开头任意数量的0。

由于手机号码是13任意数字9位，和15任意数字9位，所以可以用(13|15)\d{9}匹配。

测试代码如下：

function testReg(reg,str){ 
  return reg.test(str); 
 } 
 var reg = /^0*(13|15)\d{9}$/; 
 var str = '13889294444'; 
 var str2 = '12889293333'; 
 var str3 = '23445567'; 
 document.write(testReg(reg,str)+'<br />'); 
 document.write(testReg(reg,str2)+'<br />'); 
 document.write(testReg(reg,str3)+'<br />');

使用正则表达式实现删除字符串中的空格：

代码以及测试代码如下：

<script type="text/javascript"> 
 //删除字符串两侧的空白字符。 
 function trim(str){ 
  return str.replace(/^\s+|\s+$/g,''); 
 } 
 //删除字符串左侧的空白字符。 
 function ltrim(str){ 
  return str.replace(/^\s+/g,''); 
 } 
 //删除字符串右侧的空白字符。 
 function rtrim(str){ 
  return str.replace(/\s+$/g,''); 
 } 
 //以下为测试代码 
 var trimTest = " 123456789 ";
//前后各有一个空格。 
 document.write('length:'+trimTest.length+'<br />');
//使用前 
 document.write('ltrim length:'+ltrim(trimTest).length+'<br />');
//使用ltrim后 
 document.write('rtrim length:'+rtrim(trimTest).length+'<br />');
//使用rtrim后 
 document.write('trim length:'+trim(trimTest).length+'<br />');
//使用trim后 
 </script>

测试的结果如下：

length:11
 ltrim length:10
 rtrim length:10
 trim length:9

限制文本框只能输入数字和小数点等等

只能输入数字和小数点

var reg = /^\d*\.?\d{0,2}$/

开头有若干个数字，中间有0个或者一个小数点，结尾有0到2个数字。

只能输入小写的英文字母和小数点，和冒号，正反斜杠(：./\)

var reg = /[a-z\.\/\\:]+/;

a-z包括了小写的英文字母，\.是小数点，\/和\\分别是左右反斜线，最后是冒号。整个组成一个字符集和代码任一均可，最后在加上+，1或者多个。

替换小数点前内容为指定内容

请问怎么把这个字符串的小数点前面的字符替换为我自定义的字符串啊？
例如：infomarket.php?id=197 替换为 test.php?id=197
应该可以把第一个点“.”之前的所有单词字符替换为test就可以了。我写的正则如下：

<script type="text/javascript"> 
 var str = "infomarket.php?id=197"; 
 var reg = /^\w*/ig; 
 //匹配字符串开头的任意个单词字符 
 str = str.replace(reg,'test'); 
 document.write(str); 
 </script>

原帖的有点复杂，没太看明白。

只匹配中文的正则表达式

前两天看的《JavaScript开发王》里恰好有中文的unicode范围，正则如下：

/[\u4E00-\u9FA5\uf900-\ufa2d]/

写了一个简单的测试，会把所有的中文替换成“哦”。

<script type="text/javascript"> 
 var str = "有中文?and English."; 
 var reg = /[\u4E00-\u9FA5\uf900-\ufa2d]/ig; 
 str = str.replace(reg,'哦'); 
 document.write(str); 
 </script>

返回字符串的中文字符个数

一般的字符长度对中文和英文都是不分别的如JS里的length，那么如何返回字符串中中文字符的个数呢？guoshuang老师在原帖中给出了解决方案，我又没看懂……

不过我自己也想到了一个办法：先去掉非中文字符，再返回length属性。函数以及测试代码如下：

<script type="text/javascript"> 
 function cLength(str){ 
  var reg = /[^\u4E00-\u9FA5\uf900-\ufa2d]/g; 
  //匹配非中文的正则表达式 
  var temp = str.replace(reg,''); 
  return temp.length; 
 } 
 var str = "中文123"; 
 document.write(str.length+'<br />'); 
 document.write(cLength(str)); 
 </script>

结果：

5
 2

中文两个，数字三个，正确。

下面的测试也正确。

var str = "中文123tets@#!#%$#[][{}"; 
 document.write(str.length+'<br />'); 
 document.write(cLength(str));

正则表达式取得匹配IP地址前三段

192.168.118.101，192.168.118.72, 192.168.118.1都替换成：192.168.118

只要匹配掉最后一段并且替换为空字符串就行了，正则如下：

/\.\d{1,3}$/

匹配结尾的.n,.nn或者.nnn。

测试代码如下：

function replaceReg(reg,str){ 
  return str.replace(reg,'') 
 } 
 var reg = /\.\d{1,3}$/; 
 var str = '192.168.118.101'; 
 var str2 = '192.168.118.72'; 
 var str3 = '192.168.118.1'; 
 document.write(replaceReg(reg,str)+'<br />'); 
 document.write(replaceReg(reg,str2)+'<br />'); 
 document.write(replaceReg(reg,str3)+'<br />');

匹配<ul>与<ul>之间的内容
<ul>safsf<ul>safsf</ul><ul>safsf</ul></ul>

用正则可以得到 <ul>起到下个<ul> 之间的内容。

正则如下：

/<ul>[\s\S]+?<ul>/i

首先匹配两侧的ul标签，中间的[\s\S]+?可以匹配一个或者多个任意字符，一定要非贪婪，否则会匹配<ul>safsf<ul>safsf</ul><ul>。

用正则表达式获得文件名

c:\images\tupian\006.jpg

可能是直接在盘符根目录下，也可能在好几层目录下，要求替换到只剩文件名。

xlez的正则如下：

/[^\\\/]*[\\\/]+/g

首先匹配非左右斜线字符0或多个，然后是左右斜线一个或者多个。形如“xxx/”或者“xxx\”或者“/”或者“\”

函数以及测试代码：

<script type="text/javascript"> 
 function getFileName(str){ 
  var reg = /[^\\\/]*[\\\/]+/g; 
  //xxx\或者是xxx/ 
  str = str.replace(reg,''); 
  return str; 
 } 
 var str = "c:\\images\\tupian\\006.jpg"; 
 document.write(getFileName(str)+'<br />'); 
 var str2 = "c:/images/tupian/test2.jpg"; 
 document.write(getFileName(str2)); 
 </script>

注意，\需要转义。

绝对路径变相对路径

将<IMG height="120" width="800" src="http://23.123.22.12/image/somepic.gif">转换为：<IMG height="120" width="800" src="/image/somepic.gif">。

其中网址可能改变，例如http://localhost等等。

cloudchen的正则：

/http:\/\/[^\/]+/

首先是http://，然后[^\/]+找过1个或者多个非/字符，因为遇到第一个/表示已经到目录了，停止匹配。

测试代码如下：

<script type="text/javascript"> 
 var str = '<IMG height="120" width="800" \
src="http://23.123.22.12/image/somepic.gif">'; 
 var reg = /http:\/\/[^\/]+/; 
 str = str.replace(reg,""); 
 alert(str) 
 </script>

用户名正则

用于用户名注册，，用户名只能用中文、英文、数字、下划线、4-16个字符。

hansir和解决方案弄成正则：

/^[\u4E00-\u9FA5\uf900-\ufa2d\w]{4,16}$/

中文字符或者单词字符，4到16个。实现4到16结成到正则里的关键就是开始^和结束$，这就等于整个字符串只能有这些匹配的内容，不能有多余的。

函数和测试代码如下：

<script type="text/javascript"> 
 function isEmail(str){ 
  var reg = /^[\u4E00-\u9FA5\uf900-\ufa2d\w]{4,16}$/; 
   return reg.test(str); 
 } 
 var str = '超级无敌用户名regExp'; 
 var str2 = '捣乱的@'; 
 var str3 = '太短' 
 var str4 = '太长longlonglonglonglonglonglonglong' 
 document.write(isEmail(str)+'<br />'); 
 document.write(isEmail(str2)+'<br />'); 
 document.write(isEmail(str3)+'<br />'); 
 document.write(isEmail(str4)+'<br />'); 
 </script>

匹配英文地址

规则如下:
包含 "点", "字母","空格","逗号","数字"，但开头和结尾不能是除字母外任何字符。

[\.a-zA-Z\s,0-9]这个字符集就实现了字母，空格，逗号和数字。最终正则如下：

/^[a-zA-Z][\.a-zA-Z\s,0-9]*?[a-zA-Z]+$/

开头必须有字母，结束也必须是一个以上字母。测试代码如下：

<script type="text/javascript"> 
 function testReg(reg,str){ 
  return reg.test(str); 
 } 
 var reg = /^[a-zA-Z][\.a-zA-Z\s,0-9]*?[a-zA-Z]+$/; 
 var str = 'No.8,ChangAn Street,BeiJing,China'; 
 var str2 = '8.No,ChangAn Street,BeiJing,China'; 
 var str3 = 'No.8,ChangAn Street,BeiJing,China88'; 
 document.write(testReg(reg,str)+'<br />') 
 document.write(testReg(reg,str2)+'<br />') 
 document.write(testReg(reg,str3)+'<br />') 
 </script>

正则匹配价格

价格的格式应该如下：

开头数字若干位，可能有一个小数点，小数点后面可以有两位数字。hansir给出的对应正则如下：

/^(\d*\.\d{0,2}|\d+).*$/

hansir给出的测试代码如下：

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" 
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> 
 <html xmlns="http://www.w3.org/1999/xhtml"> 
 <head> 
 <meta http-equiv="Content-Type" content="text/html; charset=gb2312" /> 
 <title>无标题文档</title> 
 <script type="text/javascript"> 
 function checkPrice(me){ 
  if(!(/^(?:\d+|\d+\.\d{0,2})$/.test(me.value))){ 
  me.value = me.value.replace(/^(\d*\.\d{0,2}|\d+).*$/,'$1'); 
  } 
 } 
 </script> 
 </head> 
 <body> 
 <input type="text" οnkeyup="checkPrice(this);"/> 
 </body> 
 </html>

身份证号码的匹配

身份证号码可以是15位或者是18位，其中最后一位可以是X。其它全是数字，正则如下：

/^(\d{14}|\d{17})(\d|[xX])$/

开头是14位或者17位数字，结尾可以是数字或者是x或者是X。

测试代码如下：

<script type="text/javascript"> 
 function testReg(reg,str){ 
  return reg.test(str); 
 } 
 var reg = /^(\d{14}|\d{17})(\d|[xX])$/; 
 var str = '123456789012345';//15位 
 var str2 = '123456789012345678';//18位 
 var str3 = '12345678901234567X';//最后一位是X 
 var str4 = '1234';//位数不对 
 document.write(testReg(reg,str)+'<br />'); 
 document.write(testReg(reg,str2)+'<br />'); 
 document.write(testReg(reg,str3)+'<br />'); 
 document.write(testReg(reg,str4)+'<br />'); 
 </script>

要求文本有指定行数

匹配至少两行的字符串，每行都为非空字符。

只要匹配到[\n\r]就表示有换行了，再保证换行的两段都不是空字符就可以了。正则如下：

/\S+?[\n\r]\S+?/i

这个正则的应用应该是用在textarea里，如果是如下要求：可以支持所有字符，中间可带空格，可以包括英文、数字、中文、标点

这样的话，只要针对空格再改一下就行了。（按照非空的要求，上面有不能匹配“字符+空格+换行+字符”的字符串）。修改如下：

/\S+?\s*?[\n\r]\s*?\S+?/i

单词首字母大写

每单词首字大写，其他小写。如blue idea转换为Blue Idea，BLUE IDEA也转换为Blue Idea

cloeft的正则：

/\b(\w)|\s(\w)/g

所谓“首字母”包括两种情况：第一种是边界(开头)的单词字符，一种是空格之后的新单词的第一个字母。测试代码如下：

<script type="text/javascript"> 
 function replaceReg(reg,str){ 
  str = str.toLowerCase(); 
  return str.replace(reg,function(m){return m.toUpperCase()}) 
 } 
 var reg = /\b(\w)|\s(\w)/g; 
 var str = 'blue idea'; 
 var str2 = 'BLUE IDEA'; 
 var str3 = 'Test \n str is no good!'; 
 var str4 = 'final test'; 
 document.write(replaceReg(reg,str)+'<br />'); 
 document.write(replaceReg(reg,str2)+'<br />'); 
 document.write(replaceReg(reg,str3)+'<br />'); 
 document.write(replaceReg(reg,str4)+'<br />'); 
 </script>

正则验证日期格式

yyyy-mm-dd格式

正则如下：

/^\d{4}-\d{1,2}-\d{1,2}$/

4位数字，横线，1或者2位数字，再横线，最后又是1或者2位数字。

测试代码如下：

<script type="text/javascript"> 
 function testReg(reg,str){ 
  return reg.test(str); 
 } 
 var reg = /^\d{4}-\d{1,2}-\d{1,2}$/; 
 var str = '2008-8-8'; 
 var str2 = '2008-08-08'; 
 var str3 = '08-08-2008'; 
 var str4 = '2008 08 08'; 
 document.write(testReg(reg,str)+'<br />'); 
 document.write(testReg(reg,str2)+'<br />'); 
 document.write(testReg(reg,str3)+'<br />'); 
 document.write(testReg(reg,str4)+'<br />'); 
 </script>

yyyy-mm-dd
或
yyyy/mm/dd

用“或”简单地修改一下就行了。

/^\d{4}(-|\/)\d{1,2}(-|\/)\d{1,2}$/

去掉文件的后缀名

www.abc.com/dc/fda.asp变为www.abc.com/dc/fda

如果文件后缀已知的话这个问题就非常简单了，正则如下：

/\.asp$/

匹配最后的.asp而已，测试代码如下：

<script type="text/javascript"> 
 function delAspExtension(str){ 
  var reg = /\.asp$/; 
  return str.replace(reg,''); 
 } 
 var str = 'www.abc.com/dc/fda.asp'; 
 document.write(delAspExtension(str)+'<br />'); 
 </script>

如果文件名未知的话就用这个正则：/\.\w+$/，测试代码如下：

<script type="text/javascript"> 
 function delExtension(str){ 
  var reg = /\.\w+$/; 
  return str.replace(reg,''); 
 } 
 var str = 'example.com/dc/fda.asp'; 
 document.write(delExtension(str)+'<br />'); 
 var str2 = 'test/regular/fda.do'; 
 document.write(delExtension(str2)+'<br />'); 
 var str3 = 'example.com/dc/fda.strange_extension'; 
 document.write(delExtension(str3)+'<br />'); 
 </script>

验证邮箱的正则表达式

来源：找javascript写的表单检查代码！

fuchangxi的正则：

/^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/

开始必须是一个或者多个单词字符或者是-，加上@，然后又是一个或者多个单词字符或者是-。然后是点“.”和单词字符和-的组合，可以有一个或者多个组合。

<script type="text/javascript"> 
 function isEmail(str){ 
  var reg = /^([a-zA-Z0-9_-])+@([a-zA-Z0-9_-])+(\.[a-zA-Z0-9_-])+/; 
  return reg.test(str); 
 } 
 var str = 'test@hotmail.com'; 
 document.write(isEmail(str)+'<br />'); 
 var str2 = 'test@sima.vip.com'; 
 document.write(isEmail(str2)+'<br />'); 
 var str3 = 'te-st@qq.com.cn'; 
 document.write(isEmail(str3)+'<br />'); 
 var str4 = 'te_st@sima.vip.com'; 
 document.write(isEmail(str4)+'<br />'); 
 var str5 = 'te.._st@sima.vip.com'; 
 document.write(isEmail(str5)+'<br />'); 
 </script>

匹配源代码中的链接

能够匹配HTML代码中链接的正则。

原帖正则：

/<a href=".+?">.+?<\/a>/g

感觉有点严格，首先要<a href="".+?">有，而且href属性可以是一个或者多个除换行外任意字符(非贪婪)。后面是.+?<\/a>，一个或者多个除换行外任意字符（非贪婪），再加上结束标签。

有个问题，如果a的起始标签最后有空格，或者除了href还有其它属性的话，上面的正则就不能匹配这个链接了。

例如：

<a href="asdfs" >……多了个空格。

<a id="xx" href=""asdfs">……前面有属性。

……

重写正则：

/<a\s(\s*\w*?=".+?")*(\s*href=".+?")(\s*\w*?=".+?")*\s*>[\s\S]*?<\/a>/

思路如下：首先要有<a和一个空格。/<a\s/

第一个(\s*\w*?=".+?")*

可以匹配一个属性，属性前面可能有或者没有多余的空格，用\s*匹配；属性名肯定是单词字符，用\w*?匹配；=".+?"就是匹配属性值了非换行字符若干个；整个括号外面加个*表示可能有任意多个属性。

(\s*href=".+?")

匹配href，它也是一个属性，所以只要把上面子正则表达式中的\w修改为href=就行了。

(\s*\w*?=".+?")*重复第一个子正则表达式，再次接受任意个属性。

\s*>，属性最后再加上若干个空格和>。

[\s\S]*?，链接的文字，可能有任何字符组成，若干个，非贪婪。

<\/a>最后是结束标签。

补充：属性名和=之间，以及=和属性值之间也可能有空格。所以要再加上几个\s*。

最后的实例代码如下：

<script type="text/javascript"> 
 function findLinks(str){ 
  var reg = /<a\s(\s*\w*?\s*=\s*".+?")*(\s*href\s*=\s*".+?")(\s*\w*?\s*=\s*".+?") 
 *\s*>[\s\S]*?<\/a>/g; 
  var arr = str.match(reg); 
  for(var i=0;i<arr.length;i++){ 
  //alert(arr[i]); 
  document.write('link:'+arr[i]+'<br />'); 
  } 
 } 
 var str = '<p>测试链接：<a id = "test" href="http://bbs.blueidea.com" title="无敌">经典论坛 
 </a></p><a? href = "http://www.blueidea.com/"? >蓝色理想</a>'; 
 var arr = findLinks(str); 
 </script>

会把所有的链接在页面直接显示出来。注意，

本帖遗留问题：如何执行从右到左的匹配。貌似JS或者VBS没有提供这个功能2、JS或者VBS不支持后行断言。。用什么方法实现这个功能。

匹配链接的文字

代码：<a href="#>这里要保存</a>，只保存链接的文本内容，标签信息删掉。

前面写过一个匹配链接的正则：

/<a\s(\s*\w*?=".+?")*(\s*href=".+?")(\s*\w*?=".+?")*\s*>[\s\S]*?<\/a>/

不过我们需要捕获的是文字内容，所以需要做一定的修改。第一步就是在所有的括号内都加上?:表示不捕获。第二步就是再多加一个括号放在[\s\S]*?两侧，这样就可以捕获到链接的文字内容了。最后正则如下：

/<a\s(?:\s*\w*?\s*=\s*".+?")*(?:\s*href\s*=\s*".+?")(?:\s*\w*?\s*=\s*".+?")*\s*>([\s\S]*?)<\/a>/

测试代码如下：

<script type="text/javascript"> 
 function anchorText(str){ 
  var reg =/<a\s(?:\s*\w*?\s*=\s*".+?")*(?:\s*href\s*=\s*".+?")(?:\s*\w*?\s*=\s*".+?")*\s*> 
 
 ([\s\S]*?)<\/a>/; 
  str = str.replace(reg,'$1'); 
  return str; 
 } 
 var str = '<a id = "test" href="http://bbs.blueidea.com" title="无敌">经典论坛</a>'; 
 document.write(anchorText(str)); 
 </script>

正则判断标签是否闭合

例如：<img xxx=”xxx” 就是没有闭合的标签；

<p>p的内容，同样也是没闭合的标签。

从简单的正则开始，先匹配起始标签

/<[a-z]+/i

再加上若干属性：

/<[a-z]+(\s*\w*?\s*=\s*".+?")*/i

下面就到关键点了，标签的闭合。标签可能有两种方式闭合，<img xxx=”xxx” />

或者是<p>xxx </p>。

(\s*\/>)

匹配img类的结束，即/>。

(\s*?>[\s\S]*?<\/\1>)

匹配\p类标签的结束标签。>是其实标签末尾，之后是标签内容若干个任意字符，最后的<\/\1>就是结束标签了。

加上一个或就可以解决了，最后的完整正则表达式：

整个正则：

/<([a-z]+)(\s*\w*?\s*=\s*".+?")*(\s*?>[\s\S]*?<\/\1>|\s*\/>)/i

拿这个正则，只要匹配到了就表示闭合，没匹配到则没有闭合。不过没有考虑相同标签嵌套的问题，例如

<div>aaaaaa<div>test</div>

也被判断为合格，可以通过把最后的匹配p类结束标签写成子正则表达式，并且更改为非贪心，然后在匹配结果中检查是否成对。正则如下：

/<([a-z]+)(\s*\w*?\s*=\s*".+?")*(\s*?>[\s\S]*?(<\/\1>)+|\s*\/>)/i

用正则获得指定标签的内容

有如下代码：

<channel>
   <title>蓝色理想</title>
 </channel>
 <item>
   <title>界面设计测试规范</title>
 </item>
 <item>
     <title>《古典写实美女》漫画教程</title>
 </item>
 <item>
     <title>安远――消失的光年</title>
 </item>
 <item>
     <title>asp.net 2.0多语言网站解决方案</title>
 </item>

要求匹配item里的title而不匹配channel里的title。

基本正则：

/<title>[\s\S]*?<\/title>/gi

首先是title标签，内容为任意字符若干个，然后是title结束标签。这个正则已经能匹配到所有的title标签。

首先，我简单地修改了一下原正则：

/<title>[^<>]*?<\/title>/gi，

因为title里面不应该再嵌有其它标签，这个正则同样是匹配所有标题的内容，最后再加上不去匹配channel中的title。整个正则如下：

/<title>[^<>]*?<\/title>(?!\s*<\/channel>)/gi

(?!\s*<\/channel>)表示要匹配字符串的后面不能跟着若干个空格和一个channel的结束标签。

原帖里有很方便的测试工具，这里就不给测试代码了。

wyfh2010

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
javascript 正则表达式

经典JavaScript正则表达式--1 2010年06月20日星期日 14:04匹配结尾的数字如30CAC0040 取出403SFASDF92 取出92正则如下：/\d+$/g统一空格个数字符串内字符键有空格，但是空格的数量可能不一致，
复制链接

扫一扫