comm比较两个文件的异同

题外话:说到比较文件,过来人都用过Beyond Compare,老版本时候,我们只能右键选中用于比较的文件,再选中被比较文件,对比。 如今他有了丰富的界面,支持linux上比较文件。 干什么用的?svn管理不善的时候,版本控制做的不好的时候,你就会期望他了。这都是经验- -! 

回到正题:在shell中,也有个这么个命令---comm。 comm可用于两个文件之间的比较。可以用于文件的比较,交集,求差以及差集操作。

这个定义其实不够详细,应该是 comm逐行比较已排序的文件1和文件2.

全称:

惭愧没有找到合适的全称。 com 很明显是compare开头,m为mode。望高手指正。 

查看—help

用法:comm [选项]... 文件1 文件2 
逐行比较已排序的文件文件1 和文件2。

如果不附带选项,程序会生成三列输出。第一列包含文件1 特有的行,第二列包含 文件2 特有的行,而第三列包含两个文件共有的行。

  -1        不输出文件1 特有的行 
  -2        不输出文件2 特有的行 
  -3        不输出两个文件共有的行

  --check-order            检查输入是否被正确排序,即使所有输入行均成对 
  --nocheck-order        不检查输入是否被正确排序 
  --output-delimiter=STR    依照STR 分列

 解读:

1. --check-order

该命令默认情况下  如果希望不检验排序,可以--nocheck-order。

 2. --output-delimiter=STR

 STR 就是个表达式。 可以是任何非特殊字符

3. -1,-2

  可以写成 -12 与普通命令用起来一样

  实例:

1.建立A.txt

加入元素

apple 
orange 
gold 
silver 
steel 
iron

2. 建立B.txt

加入元素

orange 
gold 
cookies 
carrot 

可以尝试直接比较: comm A.txt B.txt

你会发现提示一个错误,没有排序。 

3. 排序

 
 
  1. sort A.txt -o A.txt; sort B.txt -o B.txt 

4. 比较

 
 
  1. $comm A.txt B.txt 
 
 
  1. apple   
  2.       carrot   
  3.       cookies   
  4.                 gold   
  5. iron   
  6.                 orange   
  7. silver   
  8. steel  
  9.  


结果实际为3列 其中第一列是文件1特有 -1表示删除第一列

第二列是文件2特有的  -2代表删除第二列

第三列代表共同有的  -3代表删除共有的列

 

4.1 打印交集:

$comm –12 A.txt B.txt

4.2 打印两个文件中不同的行

$comm –3 A.txt B.txt

补充个小修改,两列不好看,用sed删除行首的\t

$comm –3 A.txt B.txt | sed 's/^\t//'

 

实战:

  comm在实战中,只会在一些非常特殊的场景中用到。 比较简单,就不举例了。(笔者遇到的场景中,仍然坚持有更好的方案时候,不用这个命令,呵呵)。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值