正则表达式的基本符号
一、点号"."
一个点号可以代替除了换行符以外的任何一个字符,包含但不限于英文字母、数字、汉字、英文标点和中文标点。such as:
aabbbcc
aaQWQcc
aaORZcc
aa你好啊cc
都可以表示为aa...cc
。中间有多少个字就用多少个点。
二、星号"*"
一个星号可以表示它前面的一个子表达式(普通字符、另一个或几个正则表达式符号)0次到无限次。such as:
ccsb
ccsbb
ccsbbbbbbbbbbbbb
都可表示为ccsb*
。
三、问号"?"
问号表示前面的子表达式0次或者1次。ps:这里的问号是英文问号。such as:
笑起来。
笑起来哈。
在“来”跟“。”之间有0个或1个“哈”字,都可以用笑起来?。
来表示。
问号最大的用处就是跟点号和星号搭配起来使用,构成.*?
。通过正则表达式来提取信息的时候用到最多的也是这个组合。such as:
如哈
如果快乐哈
如果快乐你就笑哈哈哈哈哈
如果你知道1+1=2请计算地球的半径哈
都可以用如.*?哈
来表示。
四、反斜杠" \ "
反斜杠能把正则表达式符号转化为普通符号。such as:
我的密码是*123456*。
如果不加反斜杠写成我的密码是*.**。
就出问题了。这时候反斜杠就要登场了,反斜杠放在*
前面,写成“ \* ”可以把星号变成普通字符,而不再是正则表达式符号。因此,正则表达式可以写成我的密码是\*.*\*。
。
五、小括号"()"
小括号可以把括号里面的内容提取出来。
such as:
我的密码是:zzj666帮我记一下。
这时候如果只想提取zzj666
,就需要使用括号:(.*?)帮
。这样得到的结果就是zzj666
。
六、" .* " 跟 " .*? " 的区别
一句话总结:
(1)" .* " 是贪婪模式:获取最长的满足条件的字符串。
(2)" .*? " 是非贪婪模式:获取最短的满足条件的字符串。