数据整理
两样必不可少的东西:用来整理的数据以及相关的应用场景
sed
是一个基于文本编辑器ed构建的“流编辑器”。在sed
中,基本上是利用一些简短的命令来修改文件,而不是直接操作文件的内容
最常用的是s
,即替换操作
s
命令的语法如下:
s/REGEX/SUBTITUTION/
其中REGEX
部分是需要使用的正则表达式,而SUBSTITUTION
是用于替换匹配结果的文本
正则表达式
*
和 +
在默认情况下是贪婪模式,也就是说,它们会尽可能多的匹配文本。
对于某些正则表达式的实现来说,您可以给 * 或 + 增加一个? 后缀使其变成非贪婪模式,但是很可惜 sed
并不支持该后缀。不过,我们可以切换到 perl
的命令行模式,该模式支持这样编写
awk - 另外一种编辑器
awk
程序接受一个模式串(可选),以及一个代码块,指定当模式匹配时应该做何种操作。