使用正则处理:
1、普通字符:
-字母、数字、汉字、下划线、以及没有特殊定义的标点符号,都是“普通字符”,在匹配一个字符串的时候,匹配与之相同的一个字符。
\n :代表换行符
\t:制表符
\\:代表 \ 本身
\^, \$,\., \(, \), \{, \}, \?, \+, \*, \|, \[ , \], :匹配这些字符本身。
2、标准字符集合:
注意区分大小写,大写是相反的匹配:如\D:匹配一个非数字
\d : 任意一个数字,0~9 中的任意一个
\w: 任意一个字母或数字或下划线,也就是A-Z,0-9,a-z,_ 中任意一个
\s:包括空格,制表符,换行符等空白字符的其中任意一个
. :小数点可以匹配任意一个字符,如果要匹配包括“\n”在内的所有字符,一般用[\s\S]
3、自定义字符集合: ^:取反的意思
[ab5@] :匹配 a,b,5或者@
[^abc] :匹配 a,b,c 之外的任意一个字符
[f-k] : 匹配f~k 之间任意一个字母
[^A-F0-3] :匹配 A~F,0~3之外的任意一个字符
4、量词(Quantifier):
{n} :表示 重复 n 次
{m,n} :表示至少重复 m次,最多重复n 次
{m,} :表示至少重复m此
? :匹配0次 或者1次,相当于 {0,1}
+: 表示至少出现1次,相当于{1,}
* :表示不出现或 任意次,相当于{0,}
5、字符边界
^123与[^123]:^数字或字符串:表示匹配第一次出现;[^数字或字符串]:取反
^i :匹配i 第一次出现
i$:匹配最后出现的i
\b: 匹配一个单词边界:前面的字符和后面的字符不全是\w
固话+手机:(0\d{2,3}-\d{7,9})|1[350897]\d{9}
邮箱匹配:[\w\-]+@[a-z0-9A-Z]{2,4}+(\.[a-zA-Z]{2,4}){1,2}