这两者之间的差别,不用说了,网上一大把。
sub替换leftmost,gsub是所有的。
测试数据data.txt:
ddxddltx abcddexxddtttdd
abcddtdd ddxx tltddjjdd
xgddelwd ggdd ltddtddrr
cat data.txt | awk -F"\t" '{gsub("dd","*",$3); print $0}'
ddxddltx abcdd exx*ttt*
abcddtdd ddxx tlt*jj*
xgddelwd ggdd lt*t*rr
cat data.txt | awk -F"\t" '{sub("dd","*",$3); print $0}'
ddxddltx abcdd exx*tttdd
abcddtdd ddxx tlt*jjdd
xgddelwd ggdd lt*tddrr
看到差别了吧。
因为本人对正则表达式比较迟钝,我在测试时,费了半天劲。我是这么测的,
cat data.txt | awk -F"\t" '{gsub(/.*dd/,"*dd",$3); print $0}'
ddxddltx abcdd *dd
abcddtdd ddxx *dd
xgddelwd ggdd *ddrr
用sub和gsub的结果都一样。
而对我上一个博客中两个都用了,这是不好的习惯,其实我是想应用到所有的,因此应该都用gsub的,只是,我的数据中,每列都有一种存在,再者我把所有列都处理了,用的是默认$0的省略输入。而且我用的是正则表达式,所以暂时没有错。