通常在处理文本文件时,您需要在一个或多个文件中查找和替换文本字符串。
sed可以对文件和输入流(如管道)执行基本文本操作。有了sed你可以搜索,查找和替换,插入和删除文字和线条。它支持基本和扩展的正则表达式,允许您匹配复杂的模式。
在本文中,我们将讨论如何查找和替换字符串sed。我们还将向您展示如何执行递归搜索和替换。
使用sed查找和替换字符串
有几个版本的sed,它们之间存在一些功能差异。macOS使用BSD版本,大多数Linux发行版都sed默认预装了GNU 。我们将使用GNU版本。
搜索和替换文本的一般形式采用sed以下形式:
sed -i 's/SEARCH_REGEX/REPLACEMENT/g' INPUTFILE
-i- 默认情况下sed将其输出写入标准输出。此选项告诉sed您编辑文件。如果提供了扩展名(例如-i.bak),则将创建原始文件的备份。
s - substitute命令,可能是sed中最常用的命令。
/ / / - 分隔符。它可以是任何字符,但通常使用斜杠(/)字符。
SEARCH_REGEX - 正常字符串或要搜索的正则表达式。
REPLACEMENT - 替换字符串。
g - 全球替换标志。默认情况下,sed逐行读取文件并仅更改第一次出现的SEARCH_REGEX行。当提供替换标志时,将替换所有出现的事件。
INPUTFILE - 要运行命令的文件的名称。
在参数周围加上引号是一个很好的做法,因此shell元字符不会扩展。
让我们看看如何使用该sed命令搜索和替换文件中的文本及其一些最常用的选项和标志的示例。
出于演示目的,我们将使用以下文件 file.txt:
123 Foo foo foo
foo /bin/bash Ubuntu foobar 456
如果省略该g标志,则只替换每行中搜索字符串的第一个实例:
sed -i 's/foo/linux/' file.txt
输出:
123 Foo linux foo
linux /bin/bash Ubuntu foobar 456
使用全局替换标志sed替换所有出现的搜索模式:
sed -i 's/foo/linux/g' file.txt
123 Foo linux linux
linux /bin/bash Ubuntu linuxbar 456
正如你可能已经注意到,在前面的例子中的子foo里面foobar串也被替换。如果这不是想要的行为,请\b在搜索字符串的两端使用word-boundery expression()。这可确保部分单词不匹配。
sed -i 's/\bfoo\b/linux/g' file.txt
输出
123 Foo linux linux
linux /bin/bash Ubuntu foobar 456
要使模式匹配不区分大小写,请使用该I标志。在下面的示例中,我们使用g和I标志:
sed -i 's/foo/linux/gI' file.txt
输出
123 linux linux linux
linux /bin/bash Ubuntu linuxbar 456
如果要查找并替换包含分隔符(/)的字符串,则需要使用反斜杠(\)来转义斜杠。例如,以取代/bin/bash与/usr/bin/zsh你会使用
sed -i 's/\/bin\/bash/\/usr\/bin\/zsh/g' file.txt
更容易和更易读的选项是使用另一个分隔符。大多数人使用竖线(|)或冒号(:),但您可以使用任何其他字符:
sed -i 's|/bin/bash|/usr/bin/zsh|g' file.txt
输出
123 Foo foo foo
foo /usr/bin/zsh Ubuntu foobar 456
您还可以使用正则表达式。例如,要搜索所有3位数字并将其替换为number您将使用的字符串:
sed -i 's/\b[0-9]\{3\}\b/number/g' file.txt
输出
number Foo foo foo
foo /bin/bash demo foobar number
sed的另一个有用功能是你可以使用&与匹配模式相对应的&符号。该角色可以多次使用。
例如,如果要{}在每个3位数字周围添加花括号,请键入:
sed -i 's/\b[0-9]\{3\}\b/{&}/g' file.txt
输出
{123} Foo foo foo
foo /bin/bash demo foobar {456}
最后但同样重要的是,在编辑文件时进行备份总是一个好主意sed。要做到这一点,只需提供-i选项的扩展。例如,要编辑file.txt并保存原始文件,如下所示file.txt.bak:
sed -i.bak 's/foo/linux/g' file.txt
如果要确保创建备份,请使用以下ls命令列出文件:
ls
输出
file.txt file.txt.bak
递归查找和替换
有时,您希望以递归方式在目录中搜索包含字符串的文件,并替换所有文件中的字符串。这可以通过使用命令来完成,find或者grep以递归方式查找目录中的文件并将文件名汇总到sed。
以下命令将递归搜索当前工作目录中的文件并将文件名传递给sed。
find . -type f -exec sed -i 's/foo/bar/g' {} +
为避免名称中包含空格的文件出现问题,请使用-print0告诉find打印文件名的选项,后跟空字符并将输出sed通过管道使用xargs -0:
find . -type f -print0 | xargs -0 sed -i 's/foo/bar/g'
要排除目录,请使用该-not -path选项。例如,如果要替换本地git仓库中的字符串以排除以dot(.)开头的所有文件,请使用:
find . -type f -not -path '*/\.*' -print0 | xargs -0 sed -i 's/foo/bar/g'
如果您只想在具有特定扩展名的文件上搜索和替换文本,您可以使用:
find . -type f -name "*.md" -print0 | xargs -0 sed -i 's/foo/bar/g'
另一种选择是使用该sed:
grep -rlZ 'foo' . | xargs -0 sed -i.bak 's/foo/bar/g'
写在最后
虽然看起来复杂而复杂,但首先,搜索和替换文件中的文本sed非常简单。
要了解有关sed命令,选项和标志的更多信息,请访问GNU sed手册和Grymoire sed教程。如果您有任何问题或反馈,请随时发表评论。