正则表达式
正则表达式概述
什么是正则表达式
正则表达式( RegularExpression ) 是用于匹配字符串中字符组合的模式。在JavaScript中,正则表达式也是对象。
正则表通常被用来检索、替换那些符合某个模式(规则)的文本,例如验证表单:用户名表单只能输入英文字母、数字或者下划线,昵称输入框中可以输入中文(匹配)。此外,正则表达式还常用于过滤掉页面内容中的一些敏感词(替换),或从字符串中获取我们想要的特定部分(提取)等
其他语言也会使用正则表达式,本阶段我们主要是利用JavaScript正则表达式完成表单验证
正则表达式的特点
- 灵活性、逻辑性和功能性非常的强
- 可以迅速地用极简单的方式达到字符串的复杂控制
- 对于刚接触的人来说,比较晦涩难懂。比如:^\w+([-+.]\w+)@]w+([-w+)w+([-小w+)
- 实际开发,一般都是直接复制写好的正则表达式,但是要求会使用正则表达式并且根据实际情况修改正则表达式
正则表达式在 javascript 中的使用
创建正则表达式
在JavaScript中,可以通过两种方式创建一个正则表达式
-
通过调用 RegExp对象的构造函数创建
var 变量名 = new RegExp(/表达式/);
-
通过字面量创建
var 变量名 = /表达式/;
测试正则表达式 test
test0正则对象方法,用于检测字符串是否符合该规则,该对象会返回true或false,其参数是测试字符串
regexObj.test(str)
- regexobj:是写的正则表达式
- str:我们要测试的文本
- 就是检测str文本是否符合我们写的正则表达式规范
正则表达式中的特殊字符
正则表达式的组成
一个正则表达式可以由简单的字符构成,比如/abc/,也可以是简单和特殊字符的组合,比如/ab*c/。其中特殊字符也被称为元字符,在正则表达式中是具有特殊意义的专用符号,如人、$、+等
特殊字符非常多,可以参考:
- MDN : https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Guide/Regular_Expressions
- iQuery手册:正则表达式部分
- 正则测试工具:http://tool.oschina.net/regex
这里我们把元字符划分几类
边界符
正则表达式中的边界符(位置符)用来提示字符所处的位置,主要有两个字符
如果 ^ 和 $ 在一起,表示必须是精确匹配
字符类
字符类表示有一系列字符可供选择,只要匹配其中一个就可以了。所有可供选择的字符都放在方括号内
[-] 方括号内部 范围符 -
[^] 方括号内部 取反符^
/^[^abc]$/.test('a') // false
// 边界符 ^ $
var rg = /abc/;
// 正则表达式里面不需要加引号 不管是数字型还是字符串型
// /abc/ 只要包含有abc这个字符串返回的都是true
console.log(rg.test( 'abc'));
console.log(rg.test('abcd' ));
console.log(rg.test('aabcd'));
console.log('---------------------');
var reg = /^abc/;
console.log(reg.test('abc')); // true
console.log(reg.test('abcd')); // true
console.log(reg.test('aabcd')); // false
console.log("---------------------------");
//“精确匹配 要求必须是 abc字符串才符合规范
var reg1 = /^abc$/;
console.log(reg1.test( 'abc')); // true
console.log(reg1.test( 'abcd')); // false
console.log(reg1.test('aabcd')); // false
console.log(reg1.test( 'abcabc')); // false
//var rg = /abc/; 只要包含abc就可以
// 字符类:[] 表示有一系列字符可供选择,只要匹配其中一个就可以了
var rg = /[abc]/; // 只要包含有a 或者 包含有b 或者包含有c 都返回为true
console.log(rg.test('andy')); // t
console.log(rg.test('baby')); // t
console.log(rg.test('color')); // t
console.log(rg.test('red')); // f
var rg1 = /^[abc]$/; // 三选一 只有是a 或者是 b 或者是c 这三个字母才返回 true
console.log(rg1.test('aa')); // f
console.log(rg1.test('a')); // t
console.log(rg1.test('d')); // t
console.log(rg1.test('c')); // t
console.log(rg1.test('abc')); // f
console.log('-----------');
var reg = /^[a-z]$/; // 26个英文字母任何一个字母返回true - 表示的是a 到z 的范围
console.log(reg.test('a')); // t
console.log(reg.test('z')); // t
console.log(reg.test(1)); // f
console.log(reg.test('A')); // f
// 字符组合
var reg1 = /^[a-zA-Z0-9_-]$/; // 26个英文字母(大写和小写都可以)任何一个字母返回 true
表示的是a 到z 的范围
console.log(reg1.test('a')); // t
console.log(reg1.test('B')); // t
console.log(reg1.test(8)); // t
console.log(reg1.test('-')); // t
console.log(reg1.test('_')); // t
console.log(reg1.test('!')); // f
console.log('-------------------------');
// 如果中括号里面有^ 表示取反的意思 千万和 我们边界符 ^ 别混淆
var reg2 = /^[^a-zA-Z0-9_-]$/;
console.log(reg2.test('a')); // f
console.log(reg2.test('B')); // f
console.log(reg2.test(8)); // f
console.log(reg2.test('-')); // f
console.log(reg2.test('_')); // f
console.log(reg2.test('!')); // t
量词符
量词符用来设定某个模式出现的次数
// 量词符: 用来设定某个模式出现的次数
// 简单理解: 就是让下面的a这个字符重复多少次
var reg = /^a$/;
// * 相当于 >= 0 可以出现o次或者很多次
var reg = /^a*$/;
console.log(reg.test('')); // f
console.log(reg.test('a')); // t
console.log(reg.test('aaaa')); // t
// + 相当于 >= 1 可以出现1次或者很多次
var reg = /^a+$/;
console.log(reg.test('')); // f
console.log(reg.test('a')); // t
console.log(reg.test('aaaa')); // t
// ? 相当于 1 || 0
var reg = /^a?$/;
console.log(reg.test('')); // t
console.log(reg.test('a')); // t
console.log(reg.test('aaaa')); // f
// {3} 就是重复3次
var reg = /^a{3}$/;
console.log(reg.test('')); // f
console.log(reg.test('a')); // f
console.log(reg.test('aaaa')); // f
console.log(reg.test('aaa')); // t
// {3,} 大于等于3
var reg = /^a{3,}$/;
console.log(reg.test('')); // f
console.log(reg.test('a')); // f
console.log(reg.test('aaa')); // t
console.log(reg.test('aaaa')); // t
// {3,16} 大于等于3 并且 小于等于16
var reg = /^a{3,16}$/;
console.log(reg.test('')); // f
console.log(reg.test('a')); // f
console.log(reg.test('aaa')); // t
console.log(reg.test('aaaa')); // t
console.log(reg.test('aaaaaaa')); // f
括号总结
- 大括号 量词符.里面表示重复次数
- 中括号字符集合。匹配方括号中的任意字符
- 小括号表示优先级
可以在线测试:(http://c.runoob.com/)
// 中括号 字符集合.匹配方括号中的任意字符.
var reg = /^[abc]$/;
// a 也可以 b 也可以 c 可以 等同于:a || b || c
// 大括号 量词符,里面表示重复次数
var reg = /^abc(3]$/; // 它只是让c重复三次 abccc
console.log(reg.test('abc')); // f
console.log(reg.test('abcc')); // f
console.log(reg.test('abcabcabc')); // f
console.log(reg.test('abccc')); // t
// 小括号 表示优先级
var reg = /^(abc){3}$/; // 它是让abc重复三次
console.log(reg.test('abc')); // f
console.log(reg.test('abcabcabc')); // t
console.log(reg.test('abccc')); // f
预定义类
预定义类指的是某些常见模式的简写方式
// 座机号码验证: 全国座机号码 两种格式: 010-12345678 或者 0530-1234567
// 正则里面的或者 符号 |
// var reg = /^\d{3}-\d{8}|\d{4}-\d{7}$/;
var reg = /^\d{3,4}-\d{7,8}$/;
正则表达式中的替换
replace 替换
replace0方法可以实现替换字符串操作,用来替换的参数可以是一个字符串或是一个正则表达式
stringObject.replace(regexp/substr,replacement);
- 第一个参数:被替换的字符串 或者 正则表达式
- 第二个参数:替换为的字符串
- 返回值是一个替换完毕的新字符串
正则表达式参数
/表达式/[switch]
switch(也称为修饰符)按照什么样的模式来匹配有三种值:
- g:全局匹配
- i:忽略大小写
- gi:全局匹配 + 忽略大小写