linux shell 修改文本
echo
[[email protected] tmp]#echo ‘yhqt1 test1‘ > test1.txt
[[email protected] tmp]#cat test1.txt
yhqt1 test1
[root@DSI tmp]#echo ‘yhqt2 test2‘ > test1.txt
[[email protected] tmp]#cat test1.txt
yhqt2 test2
[root@DSI tmp]#echo ‘yhqt1 test1‘ >> test1.txt ##追加
[[email protected] tmp]#cat test1.txt
yhqt2 test2
yhqt1 test1
##增加文本
[[email protected] tmp]#cat >> test1.txt << EOF
export HISTTIMEFORMAT=‘%F %T ‘
EOF
sed
[[email protected] tmp]#sed -i ‘$a test3‘ test1.txt ##$最后一行,a是新增
[[email protected] tmp]#cat test1.txt
yhqt2 test2
yhqt1 test1
test3
[root@DSI tmp]#sed ‘/yhqt1/a\test4‘ test1.txt ##在yhqt1 行后面增加一行test4
yhqt2 test2
yhqt1 test1
test4
test3
[root@DSI tmp]#sed ‘/yhqt1/a\test5\ntest6‘ test1.txt ##在yhqt1 行后面增加2行
yhqt2 test2
yhqt1 test1
test5
test6
test3
[root@DSI tmp]#sed ‘/yhqt1/i\test7‘ test1.txt ##在yhqt1行前面增加一行test7
yhqt2 test2
test7
yhqt1 test1
test3
[root@DSI tmp]#cat test1.txt
yhqt2 test2
test7
yhqt1 test1
test5
test6
test4
test3
test7
[root@DSI tmp]#sed -i ‘/test7/a\1111‘ test1.txt ##存在多行test7的情况,每个匹配的地方都会新增一行1111数据
[[email protected] tmp]#cat test1.txt
yhqt2 test2
test71111yhqt1 test1
test5
test6
test4
test3
test71111
##如果只向第二个test7后面增加一行,可以先获取第二个test7的行号,然后根据此行号在后面增加一行数据##获取行号
[[email protected] tmp]#cat -n test1.txt |grep test7 |awk ‘ {print $1}‘|sed -n "2"p
9[root@DSI tmp]#sed -n ‘/test7/=‘ test1.txt |sed -n "2"p
9[root@DSI tmp]#sed -e ‘9a\2222‘ test1.txt
yhqt2 test2
test71111yhqt1 test1
test5
test6
test4
test3
test72222
1111[root@DSI tmp]#sed ‘s/test5/& yhq1314/g‘ test1.txt ##在指定行test5后面增加数据yhq1314
yhqt2 test2
test71111yhqt1 test1
test5 yhq1314
test6
test4
test3
test71111[root@DSI tmp]#sed -i ‘s|test2|test222|‘ test1.txt ##对字符串进行替换test2替换为test222
[[email protected] tmp]#cat test1.txt
yhqt2 test222
test71111yhqt1 test1
test5 yhq1314
test6
test4
test3
test71111[root@DSI tmp]#sed -i ‘$a yhq,abc1,3456‘ test1.txt
[[email protected] tmp]#cat test1.txt
yhqt2 test222
test71111yhqt1 test1
test5 yhq1314
test6
test4
test3
test71111yhq,abc1,3456[root@DSI tmp]#sed -i ‘s|,|*|‘ test1.txt ##替换特殊字符
[[email protected] tmp]#cat test1.txt
yhqt2 test222
test71111yhqt1 test1
test5 yhq1314
test6
test4
test3
test71111yhq*abc1,3456
sed是stream editor(流编辑器)的缩写,是文本处理中非常重要的工具,配合正则表达式进行使用功能更强大。
sed可以替换给定文本中的字符串,可以利用正则表达式进行匹配
$ sed ‘s/pattern/replace_string/‘ file
或者
$ cat file |sed ‘s/patter/replaces_string/‘ file
使用 -i选项,可以将替换结果应用于原文件,很多在进行替换之后,借助重定向来保存文件
$ sed ‘s/text/replace/‘ file >newfile$ mv newfile file
其实就是一个命令
$ sed -i ‘s/text/replace/‘ file
如果需要替换每一行中满足条件的内容,加参数g
$ sed ‘s/pattern/replace_string/g‘ file
后缀/g意味着sed会替换每一处匹配,如果需要从N+1开始匹配,加参数N
[[email protected] tmp]#echo this thisthisthis | sed ‘s/this/THIS/2g‘
this THISTHISTHIS
[root@DSI tmp]#echo this thisthisthis | sed ‘s/this/THIS/3g‘
this thisTHISTHIS
[root@DSI tmp]#echo this thisthisthis | sed ‘s/this/THIS/4g‘
this thisthisTHIS
#当需要从第N出匹配开始替换时,可以使用/Ng
字符/在sed中作为定界符使用。可以像下面一样
sed ‘s:text:replace:g‘
sed ‘s|text|replace|g‘
当定界符出现在样式内部时,必须使用前缀\对它进行转义
sed ‘s|te\|xt|replace|g‘
\|是一个出现在样式内部并经过转义的定界符
1 移除空白行
$ sed ‘/^$/d‘ file ##/pattern/d会移除匹配样式的行,在空白行中,行尾标记紧随着行首标记
[[email protected] tmp]#cat test1.txt
yhqt2 test222
test71111yhqt1 test1
test5 yhq1314
test6
test4
test3
test71111yhq*abc1,3456xxx
[root@DSI tmp]#sed -i ‘/^$/d‘ test1.txt
[[email protected] tmp]#cat test1.txt
yhqt2 test222
test71111yhqt1 test1
test5 yhq1314
test6
test4
test3
test71111yhq*abc1,3456xxx
2 已匹配字符串标记&
在sed中,用&标记匹配样式的字符串,就能够在替换字符串时使用已匹配的内容
[[email protected] tmp]#echo this is an example | sed ‘s/\w\+/[&]/g‘
[this] [is] [an] [example]##正则表达式\w\+ 匹配每一个单词,然后用[&]替换它,&对应于之前所匹配到的单词
3 子串匹配标记\1
&代表匹配给定样式的字符串,但也可以匹配给定样式的其中一部分
[[email protected] tmp]#echo this is digit 7 in a number | sed ‘s/digit \([0-9]\)/\1/‘
this is 7 ina number##这个命令将digit 7替换为7.样式中匹配到的子串是7,\(pattern\)用于匹配子串,模式被包括在使用斜线转义过的()中,对于匹配到的第一个子串,
其对应的标记是\1,匹配到的第二个子串是\2,往后依次类推
[root@DSI tmp]#echo seven EIGHT | sed ‘s/\([a-z]\+\) \([A-Z]\+\)/\2 \1/‘
EIGHT seven##([a-z])\+\)匹配第一个单词,\([A-Z]\+\)匹配第二个单词,\1,\2用来引用他们,这种引用称为向后引用,在替换部分,他们的次序被更改
为\2\1,因此结果就是逆序
4 组合多个表达式
sed ‘expression‘ | sed ‘expression‘
等价于
$ sed ‘expression; expression‘
5 引用
sed表达式通常用单引号来引用。也可以使用双引号。双引号会通过对表达式求值来对其进行扩展
[[email protected] tmp]#text=hello
[[email protected] tmp]#echo hello world | sed "s/$text/HELLO/" ##$text的求值结果是hello
HELLO world