上篇:https://blog.csdn.net/qq_42489308/article/details/90272575
正则表达式
场景
1.在一个文件中,查找出hello开头的语句
2.在一个文件中,找到含有hello的语句
3.在一个文件中,找到邮箱为163的所有邮件地址
正则表达式(regular expression)是一种工具,一种广泛用于匹配字符串的工具。它用一个“字符串”来描述一个特征,然后去验证另一个“字符串”是否符合这个特征。比如 表达式“ab+”描述的特征是“一个'a'和任意个'b'”,那么'ab','abb','abbbbbbbbbb'都符合这个特征。
正则表达式语法
正则表达式本质上只做一件事,那就是编写一个表达式“字符串”,然后用这个字符串去匹配目标文本。核心的核心,都在编写这个“字符串”表达式上面。
普通字符
字母、数字、汉字、下划线、以及没有特殊定义的符号,都是"普通字符"。正则表达式中的普通字符,在匹配的时候,只匹配与自身相同的一个字符。
例如:表达式c
,在匹配字符串abcde
时,匹配结果是:成功;匹配到的内容是c
;匹配到的位置开始于2,结束于3。(注:下标从0开始还是从1开始,因当前编程语言的不同而可能不同)
元字符
正则表达式中使用了很多元字符,用来表示一些特殊的含义或功能。
表达式 | 匹配 |
---|---|
. |
小数点可以匹配除了换行符\n 以外的任意一个字符 |
| |
逻辑或操作符 |
[] |
匹配字符集中的一个字符 |
[^] |
对字符集求反,也就是上面的反操作。尖号必须在方括号里的最前面 |
- |
定义[] 里的一个字符区间,例如[a-z] |
\ |
对紧跟其后的一个字符进行转义 | </