正则表达式基础版
(一)什么是正则表达式
正则表达式又称规则表达式,英文名为Regular Expreession, 在代码中常简写为regex、RegExp或RE 正则表达式用于定义一些字符串的规则,计算机可以根据正则表达式,来检查一个字符串是否符合规则,可以将字符串规则的内容提取出来。
在编写处理字符串的程序或网页时,经常会有查找符合某些复杂规则的字符串的需要。正则表达式就是用于描述这些规则的工具。换句话说,正则表达式就是记录文本规则的代码。正则表达式是用于进行文本匹配的工具,所以本文里多次提到了在字符串里搜索/查找,这种说法的意思是在给定的字符串中,寻找与给定的正则表达式相匹配的部分。有可能字符串里有不止一个部分满足给定的正则表达式,这时,每一个这样的部分被称为一个匹配。
(二)如何学习正则表达式
正则表达式的语法:
Var 变量= new RegExp(“正则表达式”,“匹配模式”);
使用typeo检查正则对象,则会返回object
Var reg = new RegExp(“a”);这个表达式可以用来检查一个字符串中是否含有字符a
在构造函数中可以传递一个匹配模式作为第二个参数
i 忽略大小写
g 全局匹配
正则表达式的方法:
Test()
—使用这个方法可以用来检查一个字符串是否符合正则表达式的规则
如果符合则返回true,否则返回false
使用字面量来创建正则表达式
语法:var 变量=/正则表达式/匹配模式
——使用字面量的方法创建更加简单
——使用构造函数创建更加灵活
[ ] 使用中括号表示范围
[abc] 等价于 a| b| c|
[a-z] 表示匹配所有的小写字母
[A-Z] 表示匹配所有的大写字母
[A-z] 表示匹配所有的字母(包含大小写)
[0-9] 表示匹配所有的数字
字符串与正则表达式相关的方 —支持正则表达式的String对象的方法
Search() -检索与正则表达式相匹配的值
- 可以搜索字符串中是否含有指定内容
- 如果搜索到指定内容,则会返回第一次出现的索引,如果没有搜索到到返回-1
- 它可以接受一个正则表达式作为参数,然后会根据正则表达式去检索字符串
- serach() 只会查找第一个,即使设置全局匹配也没用
search()使用字符串 search 方法可使用字符串作为参数。
字符串参数会转换为正则表达式:
Match() -找到一个或多个正则表达式的匹配
- 可以根据正则表达式,从一个字符串中将符合条件的内容提取出来
- 默认情况下我们的macth只会找到第一个符合要求的内容,找到以后就停止检索
我们可以设置正则表达式为全局匹配模式,这样就会匹配到所有的内容
可以为一个正则表达式设置多个匹配模式,且顺序无所谓
- match()会将匹配到的内容封装到一个数组中返回,即使只查询到一个结果
例:全局查找字符串“ain”:
Replace()-替换与正则表达式匹配的子串
Split() -把字符串分割为字符串数组
- 把字符串分割为字符串数组。
- 该方法可以传递一个正则表达式作为参数,这样方法将会根据正则表达式去拆分
- 该方法即使不指定全局匹配,也会全部拆分字符串
replace()
- 可以将字符串中指定内容替换为新的内容
- 参数说明:
1.被替换的内容
2.新的内容
量词:
- 通过量词可以设置一个内容出现的次数
- 量词只对它前面一个内容起作用
- {n} 出现n次
- {m,n} 出现m次到n次
- {n,} 出现n次以上
- + 至少出现一次
- * 出现零次或则零次以上
- ? 出现一次或则零次
^ 表示开头
$ 表示结尾
学习正则表达式的最好发法是从例子开始,理解例子之后再自己进行修改,实验。
比如:在一篇英文小说里查找 hi ,你可以使用正则表达式 hi 。
这是最简单的正则表达式了,它可以精确匹配这样的字符串:由两个字符组成,前一个字符是 h ,后一个是 i 。通常,处理正则表达式的工具会提供一个忽略大小写的选项,如果选中了这个选项,它可以匹配hi, HI,Hi, hI这四种情况中的任意一种。但是,很多单词里包含hi这两个连续的字符,比如him,history,hide等。用hi来查找的话,我们应该使用\bni\b。
\b是正则表达式规定的一个特殊代码或元字符(metacharacter),代表着单词的开头或结尾,也是单词的分界处。虽然通常英文的单词是由空格或标点符号或换行来分隔的,但是\b并不匹配这些单词分隔符中的任何一个,它只匹配一个位置。(如果需要更精确的说法,\b匹配这样的位置:它的前一个字符和后一个字符不全是(一个是,一个不是或不存在)\w)