正则表达式学习要点
什么是正则表达式
正则表达式(regular expression)是一个描述字符模式的对象。 ECMAScript的 RegExp类表示正则表达式, 而 String和 RegExp都定义了使用正则表达式进行强大的模式匹配和文本检索与替换的函数。
正则表达式主要用来验证客户端的输入数据。用户填写完表单单击按钮之后, 表单就会被发送到服务器, 在服务器端通常会用 PHP、 ASP.NET等服务器脚本对其进行进一步处理。因为客户端验证,可以节约大量的服务器端的系统资源,并且提供更好的用户体验。
创建正则表达式
创建正则表达式和创建字符串类似, 创建正则表达式提供了两种方法, 一种是采用 new运算符,另一个是采用字面量方式。
1.两种创建方式
第一种
var box = new RegExp('box'); //第一个参数字符串
var box = new RegExp('box', 'ig'); //第二个参数可选模式修饰符
模式修饰符的可选参数:
参数 | 含义 |
---|---|
i | 忽略大小写 |
g | 全局匹配 |
m | 多行匹配 |
第二种
var box = /box/; //直接用两个反斜杠
var box = /box/ig; //在第二个斜杠后面加上模式修饰符
2.测试正则表达式
RegExp对象包含两个方法: **test()**和 exec(), 功能基本相似, 用于测试字符串匹配。
test():方法在字符串中查找是否存在指定的正则表达式并返回布尔值, 如果存在则返回 true, 不存
在则返回 false。
exec():方法也用于在字符串中查找指定正则表达式,如果 exec()方法执行成功,则返回包含该查找字符串的相关信息数组。如果执行失败,则返回 null。
RegExp对象的方法:
方法 | 功能 |
---|---|
test | 在字符串中测试模式匹配,返回true或 false |
exec | 在字符串中执行匹配搜索,返回结果数组 |
/*使用 new运算符的test方法示例*/
var pattern = new RegExp('box', 'i'); //创建正则模式,不区分大小写
var str = 'This is aBox!'; //创建要比对的字符串
alert(pattern.test(str)); //通过 test()方法验证是否匹配
/*使用字面量方式的 test方法示例*/
var pattern = /box/i; //创建正则模式,不区分大小写
var str = 'This is a Box!';
alert(pattern.test(str));
/*使用一条语句实现正则匹配*/
alert(/box/i.test('This is a Box!')); //模式和字符串替换掉了两个变量
/*使用 exec返回匹配数组*/
var pattern = /box/ig;
var str = 'This is a Box Box1 Box2 Box3!';
//alert(pattern.exec(str)); //匹配了返回数组,否则返回 null
var result = null;
while((result = pattern.exec(str)) != null) {
alert(result + "|" + result.index + "==>" + pattern.lastIndex);
}
3.使用字符串的正则表达式方法
除了 test()和 exec()方法, String对象也提供了 4个使用正则表达式的方法。
String对象中的正则表达式方法:
方法 | 含义 |
---|---|
match(pattern) | 返回 pattern中的子串或 null |
replace(pattern,replacement) | 用 replacement替换pattern |
search(pattern) | 返回字符串中 pattern开始位置 |
split(pattern) | 返回字符串按指定 pattern拆分的数组 |
/*使用match方法获取获取匹配数组*/
var pattern = /box/ig; //全局搜索
var str = 'This is a Box! That is a Box too';
alert(str.match(pattern)); //匹配到两个Box,Box
alert(str.match(pattern).length); //获取数组的长度
/*使用search来查找匹配数据*/
var pattern = /box/ig;
var str = 'This is a Box! That is a Box too';
alert(str.search(pattern)); //查找到返回位置,否则返回-1
//PS: 因为search方法查找到即返回, 也就是说无需g全局
///*使用replace替换匹配到的数据*/
var pattern = /box/ig;
var str = 'This is a Box! That is a Box too';
alert(str.replace(pattern, 'Tom')); //将Box替换成了Tom
/*使用split拆分成字符串数组*/
var pattern = / /ig;
var str = 'This is a Box! That is a Box too';
alert(str.split(pattern)); //将空格拆开分组成数组
RegExp对象的静态属性:
属性 | 短名 | 含义 |
---|---|---|
input | $_ | 当前被匹配的字符串 |
lastMatch | $& | 最后一个匹配字符串 |
lastParen | $+ | 最后一对圆括号内的匹配子串 |
leftContext | $* | 最后一次匹配前的子串 |
multiline | $* | 用于指定是否所有的表达式都用于多行的布尔值 |
rightContext | $’ | 在上次匹配之后的子串 |
/*使用静态属性*/
var pattern = /(g)oogle/;
var str = 'This is google! ';
pattern.test(str); //执行一下
alert(RegExp.input); //This is google!
alert(RegExp.leftContext); //This is
alert(RegExp.rightContext); //!
alert(RegExp.lastMatch); //google
alert(RegExp.lastParen); //g
alert(RegExp.multiline); //false
所有的属性可以使用短名来操作
RegExp.input可以改写成 RegExp[’ $ _’],依次类推。但 RegExp.input比较特殊,它还可以写成RegExp.$ _。
RegExp对象的实例属性:
属性 | 含义 |
---|---|
global | Boolean值,表示g是否已设置 |
ignoreCase | Boolean值,表示i是否已设置 |
lastIndex | 整数,代表下次匹配将从哪里字符位置开始 |
multiline | Boolean值,表示m是否已设置 |
Source | 正则表达式的源字符串形式 |
/*使用静态属性*/
/*使用实例属性*/
var pattern = /google/ig;
alert(pattern.global); //true,是否全局了
alert(pattern.ignoreCase); //true,是否忽略大小写
alert(pattern.multiline); //false,是否支持换行
alert(pattern.lastIndex); //0,下次的匹配位置
alert(pattern.source); //google,正则表达式的源字符串
var pattern = /google/g;
var str = 'google google google';
pattern.test(str); //google,匹配第一次
alert(pattern.lastIndex); //6,第二次匹配的位
PS:以上基本没什么用。并且lastIndex在获取下次匹配位置上IE和其他浏览器有偏差,主要表现在非全局匹配上。 lastIndex还支持手动设置,直接赋值操作。
获取控制
正则表达式元字符是包含特殊含义的字符。它们有一些特殊功能,可以控制匹配模式的
方式。反斜杠后的元字符将失去其特殊含义。
字符类:单个字符和数字:
字符类:空白字符:
字符类:锚字符:
字符类:重复字符:
字符类:替代字符:
字符类:记录字符:
贪婪:匹配尽可能多的字符;
惰性:匹配尽可能少的字符;
/*使用静态属性*/
/*使用点元字符*/
var pattern = /g..gle/; //.匹配一个任意字符
var str = 'google';
alert(pattern.test(str));
/*重复匹配*/
var pattern = /g.*gle/; //*匹配0个一个或多个
var str = 'google'; //*,?,+,{n,m}
alert(pattern.test(str));
/*使用字符类匹配*/
var pattern = /g[a-zA-Z_]*gle/; //[a-z]*表示任意个a-z中的字符
var str = 'google';
alert(pattern.test(str));
var pattern = /g[^0-9]*gle/; //[^0-9]*表示任意个非0-9的字符
var str = 'google';
alert(pattern.test(str));
var pattern = /[a-z][A-Z]+/; //[A-Z]+表示A-Z一次或多次
var str = 'gOOGLE';
alert(pattern.test(str));
/*使用元符号匹配*/
var pattern = /g\w*gle/; //\w*匹配任意多个所有字母数字_
var str = 'google';
alert(pattern.test(str));
var pattern = /google\d*/; //\d*匹配任意多个数字
var str = 'google444';
alert(pattern.test(str));
var pattern = /\D{7,}/; {n,m} //\D{7,}匹配至少7个非数字
var str = 'google8';
alert(pattern.test(str));
/*使用锚元字符匹配*/
var pattern = /^google$/; //^从开头匹配, $从结尾开始匹配
var str = 'google';
alert(pattern.test(str));
var pattern = /goo\sgle/; //\s可以匹配到空格
var str = 'goo gle';
alert(pattern.test(str));
var pattern = /google\b/; //\b可以匹配是否到了边界
var str = 'google';
alert(pattern.test(str));
/*使用或模式匹配*/
var pattern = /google|baidu|bing/; //匹配三种其中一种字符串
var str = 'google';
alert(pattern.test(str));
/*使用分组模式匹配*/
var pattern = /(google){4,8}/; //匹配分组里的字符串 4-8次
var str = 'googlegoogle';
alert(pattern.test(str));
var pattern = /8(.*)8/; //获取 8..8之间的任意字符
var str = 'This is 8google8';
str.match(pattern);
alert(RegExp.$1); //得到第一个分组里的字符串内容
var pattern = /8(.*)8/;
var str = 'This is 8google8';
var result = str.replace(pattern, '<strong>$1</strong>'); //得到替换的字符串输出
document.write(result);
var pattern = /(.*)\s(.*)/;
var str = 'google baidu';
var result = str.replace(pattern, '$2 $1'); //将两个分组的值替换输出
document.write(result);
/*关于贪婪和惰性*/
var pattern = /[a-z]+?/; //?号关闭了贪婪匹配,只替换了第一个
var str = 'abcdefjhijklmnopqrstuvwxyz';
var result = str.replace(pattern, 'xxx');
document.write(result + '<br />');
var pattern = /8(.+?)8/g; //禁止了贪婪,开启的全局
var str = 'This is 8google8,That is 8google8,There is 8google8';
var result = str.replace(pattern, '<strong>$1</strong>');
document.write(result + '<br />');
var pattern = /8([^8]*)8/g; //另一种禁止贪婪,[^8]*表示匹配非8且有一个或者多个
var str = 'This is 8google8,That is 8google8,There is 8google8';
varresult = str.replace(pattern, '<strong>$1</strong>');
document.write(result + '<br />');
/*使用exec返回数组*/
var pattern = /^[a-z]+\s[0-9]{4}$/i;//强制结尾必须有四个数字
var str = 'google 2012';
document.write(pattern.exec(str) + '<br />'); //返回整个字符串
var pattern = /^[a-z]+/i; //只匹配字母
var str = 'google 2012';
document.write(pattern.exec(str) + '<br />'); //返回google
var pattern = /^([a-z]+)\s([0-9]{4})$/i; //使用分组
var str = 'google 2012';
document.write(pattern.exec(str)[0] + '<br />'); //google2012
document.write(pattern.exec(str)[1] + '<br />'); //google
document.write(pattern.exec(str)[2] + '<br />'); //2012
/*捕获性分组和非捕获性分组*/
var pattern = /(\d+)([a-z])/g; //捕获性分组,匹配括号的内容并获取放到集合中
var str = '123abc';
document.write(pattern.exec(str) + '<br />');
var pattern = /(\d+)(?:[a-z])/g; //非捕获性分组,(?:[a-z])匹配括号中的内容但不获取
var str = '123abc';
document.write(pattern.exec(str) + '<br />');
/*使用分组嵌套*/
var pattern = /(A?(B?(C?)))/g; //从外往内获取,?表示非贪婪
var str = 'ABC';
document.write(pattern.exec(str) + '<br />');
/*使用前瞻捕获(?:pattern)正向肯定预查|(?=pattern)正向否定预查 */
var pattern = /(goo(?=gle))/; //goo后面必须跟着gle才能捕获
var str = 'google';
document.write(pattern.exec(str) + '<br />');
/*使用特殊字符匹配*/
var pattern = /\.\[\/b\]/; //特殊字符,用\符号转义即可
var str = '.[/b]';
document.write(pattern.test(str) + '<br />');
/*使用换行模式*/
var pattern = /^\d+/mg; //启用了换行模式
var str = '1.baidu\n2.google\n3.bing';
var result = str.replace(pattern, '#');
document.write(result + '<br />');
常用的正则
1.检查邮政编码
var pattern = /[1-9][0-9]{5}/; //共6位数字,第一位不能为0
var str = '224000';
document.write(pattern.test(str));
2.检查文件压缩包
var pattern = /[\w]+\.zip|rar|gz/; //\w表示所有数字和字母加下划线
var str = '123.zip'; //\.表示匹配.,后面是一个选择
3.删除多余空格
var pattern=/\s/g; //g必须全局,才能全部匹配
var str='111 22 23 33';
var result=str.replace(pattern,''); //把空格匹配成无空格
alert(result);
4.删除首尾空格
var pattern = /^\s+/; //强制首
var str = ' goo gle ';
var result = str.replace(pattern, '');
pattern = /\s+$/; //强制尾
result = result.replace(pattern, '');
alert('|' + result + '|');
var pattern = /^\s*(.+?)\s*$/; //使用了非贪婪捕获
var str = ' google ';
alert('|' + pattern.exec(str)[1] + '|');
var pattern = /^\s*(.+?)\s*$/;
var str = ' google ';
alert('|' + str.replace(pattern, '$1') + '|'); //使用了分组获取
5.简单的电子邮件验证
var pattern = /^([a-zA-Z0-9_\.\-]+)@([a-zA-Z0-9_\.\-]+)\.([a-zA-Z]{2,4})$/;
var str = 'yc60.com@gmail.com';
alert(pattern.test(str));
var pattern = /^([\w\.\-]+)@([\w\.\-]+)\.([\w]{2,4})$/;
var str = 'yc60.com@gmail.com';
alert(pattern.test(str));
6.用户名
/^[a-z0-9_-]{3,16}$/
7.密码
/^[a-z0-9_-]{6,18}$/