正则表达式语法详解及实用实例

正则表达式Regular Expression,常简写为regexregexpRE),又称正则表示式、正则表示法、规则表达式、常规表示法,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些匹配某个模式的文本。

表达式字符

表达式描述
\d任意数字字符,等价于[0-9]
\D任意非数字的字符
\w匹配字母、数字、下划线。等价于[A-Za-z0-9_]
\W匹配非字母、数字、下划线
\s匹配所有空白符,包括换行
\S匹配非空白符

特殊字符

特殊字符描述
.匹配除换行符(\n、\r)之外的任何单个字符,相等于 [^\n\r]
()标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用
[]标记一个中括号表达式
{}标记限定符表达式
^匹配输入字符串的开始位置,除非在方括号表达式中使用,当该符号在方括号表达式中使用时,表示不接受该方括号表达式中的字符集合。
$匹配输入字符串的结尾位置
|逻辑或
\将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符

限定符

限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。有*+?{n}{n,}{n,m}共6种。

字符描述
*匹配前面的子表达式零次或多次。例如,zo* 能匹配 “z” 以及 “zoo”。* 等价于{0,}
+匹配前面的子表达式一次或多次。例如,‘zo+’ 能匹配 “zo” 以及 “zoo”,但不能匹配 “z”。+ 等价于 {1,}
?匹配前面的子表达式零次或一次。例如,“do(es)?” 可以匹配 “do” 、 “does” 中的 “does” 、 “doxy” 中的 “do” 。? 等价于 {0,1}
{n}n 是一个非负整数。匹配确定的 n 次。例如,‘o{2}’ 不能匹配 “Bob” 中的 ‘o’,但是能匹配 “food” 中的两个 o
{n,}n 是一个非负整数。至少匹配n 次。例如,‘o{2,}’ 不能匹配 “Bob” 中的 ‘o’,但能匹配 “foooood” 中的所有 o。‘o{1,}’ 等价于 ‘o+’。‘o{0,}’ 则等价于 ‘o*’
{n,m}m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。例如,“o{1,3}” 将匹配 “fooooood” 中的前三个 o。‘o{0,1}’ 等价于 ‘o?’。请注意在逗号和两个数之间不能有空格

基础实例

  • [^abc]:不包括a/b/c
  • [A-Z]:匹配大写字母A-Z
  • z{1,3}:匹配1~3个字母z
  • ^...$:匹配以开始结束的表达式
  • (a(bc)):捕获子表达式
  • (abc|def):匹配abc或def的表达式

实用实例

推荐可到RegexOne了解学习正则实例

特定文件

https://regexone.com/problem/matching_filenames
正则表达式:(\w+)\.(jpg|png|gif)$

url解析

https://regexone.com/problem/extracting_url_data
正则表达式:(\w+)://([\w\-\.]+)(:(\d+))?

base64

正则表达式:^([A-Za-z0-9+/]{4})*([A-Za-z0-9+/]{3}=|[A-Za-z0-9+/]{2}==)?$

URL_SAFE模式:安全的URL编码,base64转码过程中会生成+/=这些会被URL进行转码的特殊字符,替换为-_

org.apache.commons.codec.binary.Base64#isBase64(java.lang.String) 识别A-Za-z0-9+/-_=\n\r\t为有效字符


参考资料:

  1. 正则表达式-语法
  2. RegexOne
  3. Base64 URL Applications
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值