文本工具三剑客:都是按行读取后处理。
- grep 过滤行内容。
- awk 过滤字段。
- sed 过滤行内容;修改行内容。
1 sed编辑器
sed是一种流编辑器,流编辑器会在编辑器处理数据之前基于预先提供的一组规则来编辑数据流。
sed编辑器可以根据命令来处理数据流中的数据,这些命令要么从命令行中输入,要么存储在一个命令文本文件中。
sed主要用来自动编辑一个或多个文件;简化对文件的反复操作;编写转换程序等。
2 sed的工作流程
sed的工作流程主要包括读取、执行和显示三个过程:
sed命令可以直接在源文件中修改文件不需要交互。
3 sed命令格式
sed [option] '地址+命令' file
4 sed 查找打印p,删除d, 插入i
4.1 不指定行(顺序处理每一行)
1、sed编辑器默认输出行内容,-n选项可以禁止输出。如果不加-n,却使用p操作,那么每行内容会打印两次。
sed -e "p" :每行内容打印两次。
sed -n "p" :每行内容只打印一次。
p打印命令
2、'n' 打印行号。
sed -n '=' :只打印行号。
sed -e 'n' : 打印行号和行内容。
sed -n '=;p' :打印行号和行内容。
sed 增加a i r
a:在行后添加内容
i:在行前插入内容
r:在行后读入文件内容
d命令(删除命令)
i命令在某一行前面加入内容
a命令在某一行后面加入内容
c代表整行替换
4.2 sed 对指定行进行操作
两种方法:
- 以数字形式表示行区间;
- 用文本模式(字符串)来过滤出行(一般结合正则表达式)。
使用正则表达式,匹配行内容
注意:sed 使用扩展正则表达式时,要加 -r 。
sed 删除d
[root@yuji ~]# sed '/e$/d' ff.txt //删除以e结尾的行
two
four
seven
eight
ten
[root@yuji ~]# sed '/e$/!d' ff.txt //除了以e结尾的行,其他行都删除
one
five
nine
sed 修改替换s c y
s:替换字符串
c:整行替换
y:字符替换,替换前后的字符串长度必须相同
C整行替换
单字符替换 y
使用y,是对单个字符进行替换,每个字符需要一一对应,不是整体替换。前后字符串长度需要 一 致,不然会报错。
H复制,d删除,通过”复制后删除“来达到剪切的效果。
删除空行
sed '/^$/d' file ##删除空行
grep -v '^$' file ##过滤空行
cat file |tr -s "/n" ##通过tr -s命令压缩空行