正则表达式类似文本处理工具。
正则表达式包括两个部分一:元字符,即有特殊含义的字符 二:普通文本字符。
文本检索是正则表达式最简单的应用之一。
Egrep元字符讲解:
1 行的起始与结束 脱字符号^ 美元符号$
脱字符号^ 美元符号$这两个符号的特殊之处在于它们匹配的是个位置 不是具体的文本。
2 字符组
匹配若干字符之一用正则表达式的结构体【...】
e匹配e [ea]匹配e或a '<H[123456]>'/'<H[1-6]>'/匹配H1,H2,H3...搜索Html文件时会有用
-是个连字符 表示一个范围 【0-9A-Z_!.?】能够匹配一个数字,大写字母,下划线感叹号,点号,问号。
只有在字符组中-才是连字符,除此之外就是普通的文本字符
排除字符组
[^...]其中^表示排除
排除性字符组表示匹配一个未列出的字符
用点号匹配任意字符
03[-/.]19[-/.]20 可用03.19.20匹配 注意‘-’需要紧跟着[ 或 ^ 否则容易当连字符 处理。
多选结构
匹配任意表达式 | 意思是 或 /OR 我们能够把不同的字表达式组合成一个总的表达式
多选结构可以包括很多字符,但不能超越括号的界限
gr[ea]y与gr(e|a)y是有很大的不同,一个字符组只能匹配目标文本中的单个字符,而每个多选结构本身就是完整的正则表达式,都可以匹配任意长度的文本。
忽略大小写
-i 写在正则表达式之前表示忽略大小写,
单词分界符
元字符序列 \< \> 可以使用它们匹配单词分界的位置
可选项元素
先看看color 和 colour,匹配时 colou?r解决问题,其中 ?代表可选项 加在一个字符后面,表示允许这个字符出现,但是字符的出现不是匹配成功的必要条件。
其他量词:重复出现
+ 之前紧邻的元素出现一次或多次;
× 之前紧邻的元素出现任意次也可不出现
规定重复次数:区间
{min,max}容许出现次数的区间
正则表达式包括两个部分一:元字符,即有特殊含义的字符 二:普通文本字符。
文本检索是正则表达式最简单的应用之一。
Egrep元字符讲解:
1 行的起始与结束 脱字符号^ 美元符号$
脱字符号^ 美元符号$这两个符号的特殊之处在于它们匹配的是个位置 不是具体的文本。
2 字符组
匹配若干字符之一用正则表达式的结构体【...】
e匹配e [ea]匹配e或a '<H[123456]>'/'<H[1-6]>'/匹配H1,H2,H3...搜索Html文件时会有用
-是个连字符 表示一个范围 【0-9A-Z_!.?】能够匹配一个数字,大写字母,下划线感叹号,点号,问号。
只有在字符组中-才是连字符,除此之外就是普通的文本字符
排除字符组
[^...]其中^表示排除
排除性字符组表示匹配一个未列出的字符
用点号匹配任意字符
03[-/.]19[-/.]20 可用03.19.20匹配 注意‘-’需要紧跟着[ 或 ^ 否则容易当连字符 处理。
多选结构
匹配任意表达式 | 意思是 或 /OR 我们能够把不同的字表达式组合成一个总的表达式
多选结构可以包括很多字符,但不能超越括号的界限
gr[ea]y与gr(e|a)y是有很大的不同,一个字符组只能匹配目标文本中的单个字符,而每个多选结构本身就是完整的正则表达式,都可以匹配任意长度的文本。
忽略大小写
-i 写在正则表达式之前表示忽略大小写,
单词分界符
元字符序列 \< \> 可以使用它们匹配单词分界的位置
可选项元素
先看看color 和 colour,匹配时 colou?r解决问题,其中 ?代表可选项 加在一个字符后面,表示允许这个字符出现,但是字符的出现不是匹配成功的必要条件。
其他量词:重复出现
+ 之前紧邻的元素出现一次或多次;
× 之前紧邻的元素出现任意次也可不出现
规定重复次数:区间
{min,max}容许出现次数的区间