Linux三剑客grep、sed、awk(上篇）

最新推荐文章于 2024-08-27 12:29:30 发布

原创最新推荐文章于 2024-08-27 12:29:30 发布 · 269 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#Linux三剑客

Linux 专栏收录该内容

23 篇文章

订阅专栏

本文深入解析Linux系统中grep和sed命令的高级用法，包括grep的正则表达式搜索、上下文显示、文件处理参数，以及sed的文本编辑、行处理、模式替换功能。通过实际案例展示如何高效地进行文本搜索和编辑。

grep

Linux系统中grep命令是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。grep全称是Global
Regular Expression Print，表示全局正则表达式版本，它的使用权限是所有用户。
1.grep的主要参数

-a或–text 不要忽略二进制的数据。

-A<显示列数>或–after-context=<显示列数> 除了显示符合范本样式的那一列之外，并显示该列之后的内容。

-b或–byte-offset 在显示符合范本样式的那一列之前，标示出该列第一个字符的位编号。

-B<显示列数>或–before-context=<显示列数> 除了显示符合范本样式的那一列之外，并显示该列之前的内容。

-c或–count 计算符合范本样式的列数。

-C<显示列数>或–context=<显示列数>或-<显示列数> 除了显示符合范本样式的那一列之外，并显示该列之前后的内容。

-d<进行动作>或–directories=<进行动作> 当指定要查找的是目录而非文件时，必须使用这项参数，否则grep指令将回报信息并停止动作。

-e<范本样式>或–regexp=<范本样式> 指定字符串做为查找文件内容的范本样式。

-E或–extended-regexp 将范本样式为延伸的普通表示法来使用。

-f<范本文件>或–file=<范本文件> 指定范本文件，其内容含有一个或多个范本样式，让grep查找符合范本条件的文件内容，格式为每列一个范本样式。

-F或–fixed-regexp 将范本样式视为固定字符串的列表。

-G或–basic-regexp 将范本样式视为普通的表示法来使用。

-h或–no-filename 在显示符合范本样式的那一列之前，不标示该列所属的文件名称。

-H或–with-filename 在显示符合范本样式的那一列之前，表示该列所属的文件名称。

-i或–ignore-case 忽略字符大小写的差别。

-l或–file-with-matches 列出文件内容符合指定的范本样式的文件名称。

-L或–files-without-match 列出文件内容不符合指定的范本样式的文件名称。

-n或–line-number 在显示符合范本样式的那一列之前，标示出该列的列数编号。

-q或–quiet或–silent 不显示任何信息。

-r或–recursive 此参数的效果和指定“-d recurse”参数相同。

-s或–no-messages 不显示错误信息。

-v或–revert-match 反转查找。

-V或–version 显示版本信息。

-w或–word-regexp 只显示全字符合的列。

-x或–line-regexp 只显示全列符合的列。

-y 此参数的效果和指定“-i”参数相同。

–help 在线帮助。

2.使用案例

（1）搜寻1.txt文件中字符串"the" 注: n为显示行号
grep -n ‘the’ regular_express.txt

（2）反向搜寻特定字符串"the"
grep -vn ‘the’ regular_express.txt

（3)取得任意大小写"the"的这个字符串
#grep-in ‘the’ regular_express.txt

(4)利用括号 [] 来搜寻集合字符搜索test或taste这两个单词

grep -n ‘t[ae]st’ regular_express.txt

这样其实就是在找t[a]st和t[e]st这两个分开的字符

搜索有 oo 的字符时，则可以使用：# grep -n ‘oo’ regular_express.txt

(5)显示行首为’the’的字符串 # grep -n ‘^the’ regular_express.txt

(6)显示行首是小写字符 grep -n ‘¹’ regular_express.txt

(7)显示行尾为点 . 的那一行 grep -n ‘.$’ regular_express.txt

(8)"goog"代表gog,goog,gooog…等 grep -n’goog’ regular_express.txt

(9)找出含g…g字符串的行grep -n ‘g.*g’ regular_express.txt

3.grep与管道
grep 的输入不一定都是文件，它也常常从管道读取输入



[root@yum test]# ls grep.txt sed1.txt sed2.txt sed.txt

[root@yum test]# ls | grep "grep" grep.txt

[root@yum test]# ls | grep "^gr" grep.txt

ls 的命令的输出通过管道传给 grep。输出结果字母 gr 开头的所有行都被打印出来了，也就是说，被选中的目录被打印出来了

sed

sed 编辑器逐行处理文件（或输入），并将输出结果发送到屏幕。sed
的命令就是在 vi和 ed/ex 编辑器中见到的那些。sed 把当前正在处理的行保存在一个临时缓存区中，这个缓存区称为模式空间或临时缓冲。sed处理完模式空间中的行后,sed 编辑器逐行处理文件,并将输出结果发送到屏幕.
sed 编辑器没有破坏性，它不会修改文件，除非使用shell 重定向来保存输出结果。

1.sed命令使用

常用选项：
-n 使用安静模式，在一般情况所有的 STDIN 都会输出到屏幕上，加入-n 后只打印被 sed 特殊处理的行

-e 多重编辑，且命令顺序会影响结果

-f 指定一个 sed 脚本文件到命令行执行，

-r Sed 使用扩展正则

-i 直接修改文档读取的内容，不在屏幕上输出

Sed操作命令：

sed 操作命令告诉 sed 如何处理由地址指定的各输入行。如果没有指定地址，sed 就会处理输入的所有的行

x:指定行号。

x,y:指定从x到y的行号范围

/ pattern/:查询包含模式的行 # # % %

/ pattern/ pattern/:查询包含两个模式的行