注意:默认情况下所有的sed命令都是在模式空间内执行的,因此输入的文件并不会发生变化,除非使用 ‘sed -i ’ 修改源文件、或使用重定向输出道新的文件中。
sed命令处理大容量文件时,要拆分文件在进行处理
解决方案一(推荐用法):
使用split命令进行文件分割(例如文件如果是百万行,就创建一个单独的目录将文件分割为一百个一万行的文本)在使用sed命令进行处理。除了split分割,也可以使用一个遍历分割shell脚本进行执行
split -d -3 test.txt --按行分割
split -b 400M test.txt --按大小分割
解决方案二:
使用cat 文件名 | sed 处理 (但是该方案只能针对中大型的文件文本,如果文本量过大,处理效果不好)
sed命令的常用选项:
-e 或--expression=:表示用指定命令来处理输入的文本文件,只有一个操作命令时可省略,一般在执行多个操作命令使用
-f 或--file=:表示用指定的脚本文件来处理输入的文本文件
-h或--help:显示帮助
-i :直接修改目标文本文件
-n :仅显示script处理后的结果。读入时不显示
sed 命令的操作符
s :替换。替换指定字符
d :删除,删除指定的行
a :增加,在当前行下面增加一行指定内容
i : 插入,在选定行上面插入一行指定内容
c:替换,将指定行替换为指定内容
y:字符转换,转换前后的字符长度必须相同
p:打印,如果同时指定行,表示打印指定行,如果不指定行,则表示打印所有内容;如果有非打印字符,则以ASCII码输出。其通常与"-n"选项一起使用
=:打印行号
l(小写):打印数据流中的文本和不可打印的ASCLLII字符(比如结束符¥、制表符\t)
代码展示:
————————————————
版权声明:本文为CSDN博主「Xiayebuliang」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/Xiayebuliang/article/details/128034630