脚本处理文本的一周啊

最新推荐文章于 2023-09-25 11:40:56 发布

caoeryingzi

最新推荐文章于 2023-09-25 11:40:56 发布

阅读量858

点赞数

分类专栏： Linux

本文链接：https://blog.csdn.net/caoeryingzi/article/details/9251497

版权

Linux 专栏收录该内容

59 篇文章 0 订阅

订阅专栏

这一周就在整脚本了。

我的数据是这样子的 aaaaaameta['ddd', 'ccc', 'des', 'abcd,eee,ff,ddef']

aaaaaafront['dwd', 'xxde', 'ddes', 'ddddss,efsee,ffgg,ddrref']

我呢，要做的事情就是把方括号里的单引号内的每一个字段抽出来，然后画张表，发邮件出来。

画表、发邮件的脚本已经有了，我改改就行了。关键是前面要把方括号内的抽取出来先，然后再分割。

all=""
while read line 
do
  all=$line
  new=${all%*\]}
  result=${new##*\[}

  symbol=$(echo $line | grep "meta")
   if [ "$symbol" != "" ]
   then
      result="meta"" "$result
   else
      result="front"" "$result
   fi
  echo $result
done<$1

我用的是字段截取的方式，就是先把方括号去掉。

然后，去掉单引号。

#!/bin/sh

awk '
    { 
    result=$1 
 for(i=2;i<=NF-1;i++){
       
       len = length($i)
       if(len<=3){
        char=" "        
        }else{
         char = substr($i,2,len-3)                    
              }   
       result=result"\t"char
        }
     len=length($NF)
       if(len<=2){
        char=" "        
        }else{
         char = substr($i,2,len-2)                    
              }   
       result=result"\t"char

     print result    
    }
' $1

这个是对每一个字段把单引号去掉了。

这样的话，我的脚本很长，同时又需要好几个临时文件。

同事是牛人，脚本用的很好，awk string replace一搜索，很多人写的解决方案。好吧，我觉得我平时写代码，总是输入中文，这个是个很鸟的方法，以后要学着用english.这样，我上面的两个长脚本，就可以改成：

cat $HOME/logs/data.log | grep "front" | sed 's/.*\[/front /' | sed 's/\]//' | awk '{gsub("'\''", ""); print $0}'\
 | awk '{gsub(", "," "); print $0}' | awk '{if(NF == 13) print $0}' >>$FILE

cat $HOME/logs/data.log | grep "meta" | sed 's/.*\[/meta /' | sed 's/\]//' | awk '{gsub("'\''", ""); print $0}'\
 | awk '{gsub(", "," "); print $0}'| awk '{if(NF == 13) print $0}' >>$FILE

中间呢，根据我的实际情况，添加了过滤条件。觉得sed和其中的awk是可以只用一个的，只是我正则表达式用的不好。测试了一下，可以改成：

cat  $HOME/logs/data.log | grep "meta" | awk '{sub(/.*\[/,"meta\t"); sub(/\]/,"");gsub("'\''", "");gsub(", ","\t"); print $0}' \
 | awk -F"\t" '{if(NF == 13) print $0}' >>$FILE

如此，会造成meta和front表中的数据不间隔，因此，再改进：

cat  $HOME/logs/data.log | grep -E "meta|front" \
 | awk '{sub(/.*meta.*\[/,"meta\t");sub(/.*front.*\[/,"front\t");sub(/\]/,"");gsub("'\''", "");gsub(", ","\t"); print $0}' \
 | awk -F"\t" '{if(NF == 13) print $0}' >>$FILE

caoeryingzi

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
脚本处理文本的一周啊

这一周就在整脚本了。我的数据是这样子的 aaaaaameta['ddd', 'ccc', 'des', 'abcd,eee,ff,ddef'] aaaaaafront['dwd', 'xxde', 'ddes', 'ddddss,efsee,ffgg,ddrref']我呢，要做的事情就是把方括号里的单引号内的每一个字段抽出来，然后画张表，发邮件出来。画表、发邮件的脚本
复制链接

扫一扫

专栏目录