正则表达式
概述:正则表达式是由一系列字符和元字符构成的字符串,简称RE(Regular Expression)
主要功能书文本查询和字符串操作,他可以匹配文本的一个字符或字符集合。
正则表达式完成了数据的过滤,将不符合正则表达是的数据拒绝,留下符合的
字符匹配:
.:匹配任意单个字符
[]:匹配指定范围内任意单个字符
[^]:匹配指定范围外的任意单个字符
[[:digit:]]:匹配当前归类中的数字
[[:lower:]]:匹配当前归类中的小写字母字符
[[:upper:]]:匹配当前归类中的大写字母字符
[[:alpha:]]:匹配当前归类中的大写和小写字母字符
[[:alnum:]]:匹配当前归类中的数字,大写和小写字母字符
[[:space:]]:匹配单个空格
匹配次数:
:匹配前面的字符任意次
.:任意长度任意字符
?:匹配前面字符串0次或者1次,即可有可无
+:匹配前面的字符至少1次(扩展)
{m}:匹配前面字符m次(扩展)
{m,n}:匹配前面字符至少m,至多n次
位置锚定
^:行首锚定
行尾锚
定
P
A
T
T
E
R
N
行尾锚定 ^PATTERN
行尾锚定PATTERN:用于匹配整行
^$:空行
<:词首锚定,用于单词模式的左侧
>:词尾锚定,用于单词模式的右侧
\:匹配整个单词
分组
(xy):将xy作为一组