1、正则表达式
1.1正则表达式概念
正则表达式( Regular Expression )是用于匹配字符串中字符组合的模式。在JavaScript中,正则表达式也是对象;
正则表通常被用来检索、替换那些符合某个模式(规则)的文本,例如验证表单:用户名表单只能输入英文字母、数字或者下划线, 昵称输入框中可以输入中文(匹配)。此外,正则表达式还常用于过滤掉页面内容中的一些敏感词(替换),或从字符串中获取我们想要的特定部分(提取)等 ;
其他语言也会使用正则表达式,本阶段我们主要是利用JavaScript 正则表达式完成表单验证;
1.2正则表达式的创建
由于正则表达式本质是对象,所以其和数组等一样可以通过构造函数new方式或者字面量方法来进行创建;
1、通过调用RegExp对象的构造函数创建 :
var regexp = new RegExp(/123/);
2、通过字面量进行创建:
var rg = /123/;
1.2正则表达式的测试
即测试变量的内容是否符合所定义的正则表达式要求,test() 正则对象方法,用于检测字符串是否符合该规则,该对象会返回 true 或 false,其参数是测试字符串;
var rg = /123/;
console.log(rg.test(123));//匹配字符中是否出现123 出现结果为true
console.log(rg.test('abc'));//匹配字符中是否出现123 未出现结果为false
1.3正则表达式特殊字符
1.3.1正则表达式组成
一个正则表达式可以由简单的字符构成,比如 /abc/,也可以是简单和特殊字符的组合,比如 /ab*c/ 。其中特殊字符也被称为元字符,在正则表达式中是具有特殊意义的专用符号,如 ^ 、$ 、+ 等;
由于符号较多,具体可以在使用时进行查询;
下面详细介绍常用的符号:
1.3.2边界符
正则表达式中的边界符(位置符)用来提示字符所处的位置,主要有两个字符:
var rg = /abc/; // 正则表达式里面不需要加引号 不管是数字型还是字符串型
// /abc/ 只要包含有abc这个字符串返回的都是true,以下都是返回true
console.log(rg.test('abc'));
console.log(rg.test('abcd'));
console.log(rg.test('aabcd'));
var reg = /^abc/;
console.log(reg.test('abc')); // true
console.log(reg.test('abcd')); // true
console.log(reg.test('aabcd')); // false,其不是以abc开头
如果 ^和 $ 在一起,表示必须是精确匹配,即是只能是某个字符(开头结尾一样),见下面举例:
var reg1 = /^abc$/; // 精确匹配 要求必须是 abc字符串才符合规范
console.log(reg1.test('abc')); // true,只有内容仅是abc时才正确,其他时候全为false
console.log(reg1.test('abcd')); // false
console.log(reg1.test('aabcd')); // false
console.log(reg1.test('abcabc')); // false
1.3.3字符类
1、方括号[],表示有一系列字符可供选择,只要匹配其中一个即可:
var rg = /[abc]/; // 只要包含有a 或者 包含有b 或者包含有c 都返回为true,注意由于没有^$夹着,所以abc这三个可以同时出现,如果变为/^[abc]$/时,则只能出现一个,若出现多个如ab则会报错
console.log(rg.test('andy'));//true
console.log(rg.test('baby'));//true
console.log(rg.test('color'));//true
console.log(rg.test('red'));//false,不含有abc三个字母中的任意一个
var rg1 = /^[abc]$/; // 三选一 只有是a 或者是 b 或者是c 这三个字母才返回 true
console.log(rg1.test('aa'));//false
console.log(rg1.test('a'));//true
console.log(rg1.test('b'));//true
console.log(rg1.test('c'));//true
console.log(rg1.test('abc'));//true
[x-x]表示范围:
var reg = /^[a-z]$/ //26个英文字母任何一个字母返回 true - 表示的是a 到z 的范围
console.log(reg.test('a'));//true
console.log(reg.test('z'));//true
console.log(reg.test('A'));//false
上面的只有一类,比如只有小写字母,但想判断小写字母、大写字母、数字以及一些特殊符号一起时,则:
//字符组合
var reg1 = /^[a-zA-Z0-9]$/; // 26个英文字母(大写和小写都可以)任何一个字母返回 true,注意只能写一个,如果多个,比如aa虽然a在范围内,但由于不止一个字符其会报错
[^]方括号中有该符号表示取反,在外面则表示开始位置(注意区分):
//取反 方括号内部加上 ^ 表示取反,只要包含方括号内的字符,都返回 false ;
var reg2 = /^[^a-zA-Z0-9]$/;
console.log(reg2.test('a'));//false
console.log(reg2.test('B'));//false
console.log(reg2.test(8));//false,无论是
console.log(reg2.test('!'));//true
console.log(reg2.test('!!'));//false,虽然不在包含范围内,但超出了一个字符的长度,也会报错
2、量词符,用来设定某个模式出现的次数:
上面介绍的内容还没有讨论到字符出现次数问题,被^$包裹的内容,该字符或字符串只能出现一次,下面要通过量词符来讨论出现次数的问题:
1、重复次数大于等于0:
此时,console.log(reg2.test('aa'));
就会显示被true,因为有大于等于0个a字符;
2、重复次数大于等于1:
解析同上,只是次数有所改变;
3、重复0次或1次:
只有在‘a’或者‘’时才会为true,注意0次时不能是空格;
4、重复n次:
只有在’aaa’时才会正确;
5、大于等于n次:
var reg = /^a{3,}$ /;
6、大于等于n次小于等于m次:
//次数在3次到7次之间
var reg = /^a{3,7}$ /;
7、{}结合前面的[],表示[]中的字符任选特定个:
表示[]中的字符任选6-16个;
总结以上的各种括号:
1.大括号 量词符. 里面表示重复次数
2.中括号 字符集合。匹配方括号中的任意字符.
3.小括号表示优先级
另外测试正则表达式以及查找常用的正则表达式可以采用菜鸟工具,搜索然后找其中的正则表达式工具即可;
1.4正则表达式应用案例
结合以上知识,可以实现表单验证功能,如常见注册网站中判断输入的数据是否符合规定,并在表单右边显示响应信息,分析如下:
- 用户名只能为英文字母,数字,下划线或者短横线组成, 并且用户名长度为6~16位.
- 首先准备好这种正则表达式模式/$[a-zA-Z0-9-_]{6,16}^/
- 当表单失去焦点就开始验证.
- 如果符合正则规范, 则让后面的span标签添加 right类.
- 如果不符合正则规范, 则让后面的span标签添加 wrong类.
<input type="text" class="uname"> <span>请输入用户名</span>
<script>
// 量词是设定某个模式出现的次数
var reg = /^[a-zA-Z0-9_-]{6,16}$/; // 这个模式用户只能输入英文字母 数字 下划线 中划线
var uname = document.querySelector('.uname');
var span = document.querySelector('span');
uname.onblur = function() {
if (reg.test(this.value)) {
console.log('正确的');
span.className = 'right';
span.innerHTML = '用户名格式输入正确';
} else {
console.log('错误的');
span.className = 'wrong';
span.innerHTML = '用户名格式输入不正确';
}
}
</script>
1.5正则表达式预定义类
之前如需要限定为a-zd的范围则需要自己去写比较麻烦,而预定义类则是为了解决该问题:
预定义类是某些常见模式的简写方法:
如下座机号码的判断表达式:
即是以3位数-8位数,或者4位数-7位数的情况:
//\d{3}表示开通条3位数是0-9之间,接着-表示该位置有-符号,注意区别[]中的-表示范围,然后连接8位数字
// |符号表示或,前后两种格式都可
var reg = /^\d{3}-\d{8}|\d{4}-\d{7}$/;
var reg = /^\d{3,4}-\d{7,8}$/;
其他表单判断如下:
//手机号验证:/^1[3|4|5|7|8][0-9]{9}$/;其表示第二个号码可以是34578中任意一个接下来的9个号码可以是0-9的任意9个数字
//验证通过与不通过更换元素的类名与元素中的内容
if (reg.test(this.value)) {
// console.log('正确的');
this.nextElementSibling.className = 'success';
this.nextElementSibling.innerHTML = '<i class="success_icon"></i> 恭喜您输入正确';
} else {
// console.log('不正确');
this.nextElementSibling.className = 'error';
this.nextElementSibling.innerHTML = '<i class="error_icon"></i>格式不正确,请从新输入 ';
}
//QQ号验证: /^[1-9]\d{4,}$/; qq号只能以1-9开头,然后接最少4个任意数字的号码
//昵称验证:/^[\u4e00-\u9fa5]{2,8}$/
//验证通过与不通过更换元素的类名与元素中的内容 ,将上一步的匹配代码进行封装,多次调用即可
function regexp(ele, reg) {
ele.onblur = function() {
if (reg.test(this.value)) {
// console.log('正确的');
this.nextElementSibling.className = 'success';
this.nextElementSibling.innerHTML = '<i class="success_icon"></i> 恭喜您输入正确';
} else {
// console.log('不正确');
this.nextElementSibling.className = 'error';
this.nextElementSibling.innerHTML = '<i class="error_icon"></i> 格式不正确,请从新输入 ';
}
}
};
//密码验证:/^[a-zA-Z0-9_-]{6,16}$/
//再次输入密码只需匹配与上次输入的密码值 是否一致
1.6正则表达式实现敏感词替换
上面都是使用正则表达式进行表单验证,现结合replace替换方法实现对表单输入信息中的敏感词进行查找和替换;
示例代码如下:
var str = 'andy和red';
var newStr = str.replace('andy', 'baby');
console.log(newStr)//baby和red
//等同于 此处的andy可以写在正则表达式内
var newStr2 = str.replace(/andy/, 'baby');
console.log(newStr2)//baby和red
//全部替换,因为replace只能替换到第一次出现的字符串,而后面的字符串不能继续替换,所以第二个a没有替换
var str = 'abcabc'
var nStr = str.replace(/a/,'哈哈')
console.log(nStr) //哈哈bcabc
为了克服上述缺点,引入正则表达式参数的概念:
//全部替换g,为了克服上面的只替换第一个的缺点,引入全局替换的概念
var nStr = str.replace(/a/g,'哈哈')
console.log(nStr) //哈哈bc哈哈bc,gi下大写的A也会被替换掉
//忽略大小写i
var str = 'aAbcAba';
var newStr = str.replace(/a/gi,'哈哈')//"哈哈哈哈bc哈哈b哈哈"
由以上知识可以完成表单输入敏感词替换的案例:
<textarea name="" id="message"></textarea> <button>提交</button>
<div></div>
<script>
var text = document.querySelector('textarea');
var btn = document.querySelector('button');
var div = document.querySelector('div');
//当点下提交按钮后获取表单中输入的信息,进行替换,多个敏感词之间用|进行分隔
btn.onclick = function() {
div.innerHTML = text.value.replace(/激情|gay/g, '**');
}
</script>