awk 两个文件比较出现问题

awk 比较两个文件的异同的时候经常会用到


awk ‘{if(NR==FNR)(a[$0]=1)if(FNR!=NR){if(a[$0]!=1)print $0}}’ x1 x2

刚发现,这个东东, 要保证x1 x2 是有序的。


贴上来一个awk 脚本

防止以后忘了。 刚写的 用来分割不同文件的


awk 'BEGIN{
    a=""
    b=0;
    filehead="fingerprint"
    filenum=1
    cnum=1
}
{
 if(a==""){
        a=$1
 }
 else if(a==$1)
 {
        c[cnum]=$0;
        cnum=cnum+1
 }
 else if(a!=$1){
        b=b+1;
        if(b>100000){
                filename = filehead"_"filenum
                for (i=1;i<cnum;i++){
                        print c[i] > filename
                }
                filenum=filenum+1
                cnum=1
                c[cnum]=$0
                cnum=2
                b=0
                a=$1
        }
        else{
                c[cnum]=$0;
                cnum=cnum+1;
                a=$1
        }
 }
}END{
    filename = filehead"_"filenum
    for (i=1;i<cnum;i++){

print c[i] > filename
   }}' fingerprint.new1

不是那么简洁 ,先用着吧

今天 导入tair 

阿里的东西 真心说不上喜欢, 你说他好,他缺少好多支持,你说他不好,你又找不到过硬的理由。

就这样吧。

=====================================分割线

awk 取交集 比read line 要快1000倍



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值