文章目录
引言:
正则表达式,又称规则表达式。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本,正则表达式不只有一种,而且 Linux 中不同的程序可能会使用不同的正则表达式。
一.正则表达式定义
正则表达式,又称正规表达式、常规表达式,使用字符串来描述、匹配一些列符合某个规则的字符串
正则表达式是由普通字符与元字符组成
普通字符包括大小写字母、数字、标点符号及一些其他符号
元字符是指在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式
Linux 中常用的有两种正则表达式引擎
基础正则表达式:BRE
扩展正则表达式: ERE
二.正则表达式元字符
2.1基础正则表达式元字符
基础正则表达式常见元字符如下:
| 元字符 | 作用 |
|---|---|
| \ | 转义字符,用于取消特殊符号的含义 |
| ^ | 匹配字符串开始的位置 |
| $ | 匹配字符串结束的位置 |
| ^$ | 匹配空行 |
| . | 匹配除\n之外的任何一个字符 |
| * | 匹配前面子表达式0次或多次 |
| [list] | 匹配list列表中的一个字符 |
| [^list] | 匹配任意非列表中的一个字符 |
| {n} | 匹配前面子表达式不少于n次 |
| {n,m} | 匹配前面子表达式n到m次 |
| 注:egrep、awk使用{}匹配时不用加\转义 |
1.\!,\n,\$等
2.^a以a开头; ^#以#开头 ;^[a-z]以字母a-z开头
3.word$ 以word结尾
4.go.d 匹配一个字符,good,goad,gozd ; go…d ;匹配两个字符,goabd,goefd

本文详细介绍了正则表达式的定义、元字符,包括基础正则表达式和扩展正则表达式,并讲解了Linux中常用的文本处理工具,如cut、sort、uniq和tr的使用方法及其组合应用,帮助读者掌握Shell脚本中的文本操作技巧。
最低0.47元/天 解锁文章
403

被折叠的 条评论
为什么被折叠?



