关闭

shell脚本的字符串匹配

标签: 脚本正则表达式
1780人阅读 评论(0) 收藏 举报
分类:

今天遇到了这样的一个问题:
    在一个有几百行的模板文件中,我想找出具有vendor=xxxxx&&yyyyyy模式的行并把这个xxxxx替换成大写

那么为了方便说明问题,我举个例子,比如我有文件test,内容为:

aa=aavalue&&bb=bbvalue
aa=aa2value&&bb=bb2value
aa=aa3value&&bb=bb3value
cc=mmmmmmm&&dd=nnnnnnnnn
ee=ssssssss&&ffttttttttt

我现在希望把aa=xxxxxx&&bb=yyyyy中的xxxxxx截取出来,然后转换成大写,最后在脚本中进行相应的查找替换。

方案一:
  利用grep和shell中的变量替换
  egrep -n "^aa" test.txt|while read line;do str2=${line%%&*};str3=${str2##*aa=};echo $str3|tr a-z A-Z;done;

返回结果:
AAVALUE
AA2VALUE
AA3VALUE

再次查找并执行替换命令略。。。。
 
 注意,这里的关键部分就是${line%%&*}这一块,它的意思是"从每行的结尾开始匹配,找每行的最后一个&,然后返回剩余部分"。
 说明一下,变量的扩展匹配一共有6种,由于后两种没有用到,这里仅提供4种,分别是:
 
1> ${variable#pattern}
如果pattern匹配variable的开始部分,从variable的开始处删除字符直到第一个匹配的位置,包括匹配部分,返回剩余部分。

2> ${variable##pattern}
如果pattern匹配variable的开始部分,从variable的开始处删除字符直到最后一个匹配的位置,包括匹配部分,返回剩余部分。

3> ${variable%pattern}
如果pattern匹配variable的结尾部分,从variable的结尾处删除字符直到第一个匹配的位置,包括匹配部分,返回剩余部分。

4> ${variable%%pattern}
如果pattern匹配variable的结尾部分,从variable的结尾处删除字符直到最后一个匹配的位置,包括匹配部分,返回剩余部分。

如果我把匹配模式变成${line%&*},即:
egrep -n "^aa" test|while read line;do str2=${line%&*};echo $str2|tr [a-z] [A-Z];done;
则,结果变为:
1:aa=aavalue&
2:aa=aa2value&
3:aa=aa3value&
这就类似于正则表达式中的惰性模式和贪心模式。

那么如果我希望匹配bb=yyyyy中的yyyyyy,则需要用到${line#&*}或${line##&*}了。

方案二:

利用awk和sed
sed -n 's/aa=\(.\+\)&&.*/\1/p' test.txt|awk '{print toupper($1);}';
结果输出:
AAVALUE
AA2VALUE
AA3VALUE
再次进行查找替换方式,略。。。

终极方法:

   原来sed 里有个\U表示大小写转换的匹配关系

   sed -n 's/aa=\(.\+\)&&.*/\U\1/p' test.txt

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:129540次
    • 积分:1804
    • 等级:
    • 排名:千里之外
    • 原创:34篇
    • 转载:110篇
    • 译文:1篇
    • 评论:11条
    最新评论