Shell编程之正则表达式与文本处理器

最新推荐文章于 2024-09-17 20:39:29 发布

lian2417

最新推荐文章于 2024-09-17 20:39:29 发布

阅读量1.3k

点赞数 37

文章标签： linux 服务器运维

本文链接：https://blog.csdn.net/link2417/article/details/139965633

版权

1. 正(基础)则表达式概念

正则表达式是使用单个字符串来描述、匹配一系列符合某个句法规则的字符串，简单来说，是一种匹配字符串的方法，通过一些特殊符号，实现快速查找、删除、替换某个特定字符串

基础正则表达式是常用正则表达式最基础的部分，在 Linux 系统中常见的文件处理工具中 grep 与 sed 支持基础正则表达式，而 egrep 与 awk 支持扩展正则表达式

2. 正则表达式grep

-a 不要忽略二进制数据

-A 除了显示符合范本样式的那一行之外，并显示该行之后的内容

-b 在显示符合范本样式的那一行之外，并显示该行之前的内容

-c 计算符合范本样式的列数

-C或- 除了显示符合范本样式的那一列之外，并显示该列之前后的内容

-d 当指定要查找的是目录而非文件时，必须使用这项参数，否则grep命令将回报信息并停止动作，-e 指定字符串作为查找文件内容的范本样式

-E 将范本样式为延伸的普通表示法来使用，意味着使用能使用扩展正则表达式

-f 指定范本文件，其内容有一个或多个范本样式，让grep查找符合范本条件的文件内容，格式为每一列的范本样式

-F 将范本样式视为固定字符串的列表

-G 将范本样式视为普通的表示法来使用

-h 在显示符合范本样式的那一列之前，不标示该列所属的文件名称

-H 在显示符合范本样式的那一列之前，标示该列的文件名称

-i 忽略字符大小写的差别

-l 列出文件内容符合指定的范本样式的文件名称

-L 列出文件内容不符合指定的范本样式的文件名称

-n 在显示符合范本样式的那一列之前，标示出该列的编号

-q 不显示任何信息

-R/-r 此参数的效果和指定“-d recurse”参数相同

-s 不显示错误信息

-v 反转查找

-w 只显示全字符合的列

-x 只显示全列符合的列

-y 此参数效果跟“-i”相同

-o 只输出文件中匹配到的部分

3. 查找特定字符

（1）查看包含the的行

（2）利用[ ]查找集合字符

（3）查找字母oo前不是字母w的内容

（4）查看字母oo前不是小写字母的内容

4. 查找行首与行位

（1）查看以the为行首的行

（2）查询以小写字母开头的行

（3）查询以大写字母开

（4）查看以非字母开头的行

（5）查看以点结尾的行

（6）查询空行(非空行)

5. 查找任意字符和重复字符

（1）查找包含四字符的单词的行，单词以w开头，以d结尾

（2）查询至少包含两个字母o（oo）字符串的行

（3）查找行，行中单词包含w开头和d结尾，中间至少一个字母o

（4）查询以w开头，d结尾，中间字符可有可无

（5）查询包含数字的行

6. 文本处理器sed

sed（Stream EDitor）是一个强大而简单的文本解析转换工具，可以读取文本，并根据指定的条件对文本内容进行编辑（删除、替换、添加、移动等），最后输出所有行或者仅输出处理的某些行。sed 也可以在无交互的情况下实现相当复杂的文本处理操作，被广泛应用于 Shell 脚本中，用以完成各种自动化处理任务。 sed 的工作流程主要包括读取、执行和显示三个过程

读取：sed 从输入流（文件、管道、标准输入）中读取一行内容并存储到临时的缓冲区中（又称模式空间，pattern space）

执行：默认情况下，所有的 sed 命令都在模式空间中顺序地执行，除非指定了行的地址，否则 sed 命令将会在所有的行上依次执行

显示：发送修改后的内容到输出流，在发送数据后，模式空间将会被清空

7. sed常用选项

-n ：使用安静(silent)模式。在一般 sed 的用法中，所有来自 STDIN 的数据一般都会被列出到终端上。但如果加上 -n 参数后，则只有经过sed 特殊处理的那一行(或者动作)才会被列出来

-e ：直接在命令列模式上进行 sed 的动作编辑

-f ：直接将 sed 的动作写在一个文件内

-f filename 可以运行 filename 内的 sed 动作

-r ：sed 的动作支持的是延伸型正规表示法的语法(默认是基础正规表示法语法)

-i ：直接修改读取的文件内容，而不是输出到终端

8. sed常用操作

a ：新增行， a 的后面可以是字串，而这些字串会在新的一行出现(目前的下一行)