創建正則表達式的兩種語法
- req = new RegExp(str, flags);//str 代表你所需要匹配的字符,描述了表达式的模式。flags為可選項常用修飾符, 用于指定全局匹配、区分大小写的匹配和多行匹配。
正则表达式的修饰符可能会影响搜索结果。
在 JavaScript 中,有 5 个修饰符:
i
使用此修饰符后,搜索时不区分大小写:
A
和a
没有区别。g
使用此修饰符后,搜索时会查找所有的匹配项,而不只是第一个。
m
多行模式,執行多行匹配。(例正则表达式
/^\d+/gm
将匹配每一行的开头数字,如果/^\d+/g
只會匹配第一行的開頭數字,同理$結尾符也一樣)u
开启完整的 unicode 支持。该修饰符能够修正对于代理对的处理。
y
粘滞模式
- regexp = /pattern/; // 没有修饰符 regexp = /pattern/gmi;// 伴随修饰符 g、m 和 i(上例)
new RegExp 與 簡短語句的選擇
在写代码的时候就知道确切的 regexp 可以選擇简短语法 /.../(
它不接受任何变量插入)
。
在不清楚確切的regexp時可以選擇new RegExp ,例可以根據用戶的keydown值作為regexp的查詢標準。
常用數字字符
\d
(“d” 来自 “digit”)数字:从
0
到9
的字符。
\s
(“s” 来自 “space”)空格符号:包括空格,制表符
\t
,换行符\n
和其他少数稀有字符,例如\v
,\f
和\r
。
\w
(“w” 来自 “word”)“单字”字符:拉丁字母或数字或下划线
_
。非拉丁字母(如西里尔字母或印地文)不属于\w
。例如,
\d\s\w
表示“数字”,后跟“空格字符”,后跟“单字字符”,例如1 a
。
反向類
\D
非数字:除
\d
以外的任何字符,例如字母。
\S
非空格符号:除
\s
以外的任何字符,例如字母。
\W
非单字字符:除
\w
以外的任何字符,例如非拉丁字母或空格。
锚点:字符串开始 ^ 和末尾 $
插入符号 ^匹配文本开头,而美元符号 $
- 则匹配文本末尾。
例:"hello world!".match(/^hello/);//匹配文本開頭
例:"hello world!".match(/hello!$/);//匹配文本結尾
測試完全匹配
let req = new regExp(/^\w\w\s\w\w!$/)
"he ld!".match(req)
词边界:\b
限定字符串的截取點
例 "hello world!".match(/\bhello\b/); // hello
"hello worldaa!".match(/\bhello\b/); // null
除了字符串同樣也適用於數字
"hello 123!".match(/\b123\b/); // 123
转义,特殊字符
如果要把特殊字符作为常规字符来使用,只需要在它前面加个反斜杠。
例(. () \等)
轉義 .
"hello 1.1".match(/\d\.\d/) // "1.1"
轉義()
"hello w()".match(/w\(\)/) // "w()"
常用類
1.只有字母、数字和下划线且不能以下划线开头和结尾的正则表达式:
^(?!_)(?!.*?_$)[a-zA-Z0-9_]+$
2.只有字母和数字的: ^[a-zA-Z0-9_]+$
3.email正则表达式:两种方式都可以
(1) \w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
(2) ^[_A-Za-z0-9-]+(\\.[_A-Za-z0-9-]+)*@[A-Za-z0-9-]+(\\.[A-Za-z0-9-]+)*((\\.[A-Za-z]{2,}){1}$)
美E-Mail正则表达式:
国际域名格式如下:
域名由各国文字的特定字符集、英文字母、数字及“-”(即连字符或减号)任意组合而成, 但开头及结尾均不能含有“-”,“-”不能连续出现 。 域名中字母不分大小写。域名最长可达60个字节(包括后缀.com、.net、.org等)。
/^[a-z]([a-z0-9]*[-_]?[a-z0-9]+)*@([a-z0-9]*[-_]?[a-z0-9]+)+[\.][a-z]{2,3}([\.][a-z]{2})?$/i;
一个正则表达式,只含有汉字、数字、字母、下划线不能以下划线开头和结尾:
^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$
其中:
1.^ 与字符串开始的地方匹配
2.(?!_) 不能以_开头
3.(?!.*?_$) 不能以_结尾
4.[a-zA-Z0-9_\u4e00-\u9fa5]+ 至少一个汉字、数字、字母、下划线
放在程序里前面加@,否则需要\\进行转义 @"^(?!_)(?!.*?_$)[a-zA-Z0-9_\u4e00-\u9fa5]+$"
(或者:@"^(?!_)\w*(?<!_)$" 或者 @" ^[\u4E00-\u9FA50-9a-zA-Z_]+$ " )
只含有汉字、数字、字母、下划线,下划线位置不限:^[a-zA-Z0-9_\u4e00-\u9fa5]+$
5.由数字、26个英文字母或者下划线组成的字符串:^\w+$
6. 2~4个汉字: @"^[\u4E00-\u9FA5]{2,4}$";