linux diff

(一)概述

diff命令在最简单的情况下,比较给定的两个文件的不同。如果使用“-”代替“文件”参数,则要比较的内容将来自标准输入。diff命令是以逐行的方式,比较文本文件的异同处。如果该命令指定进行目录的比较,则将会比较该目录中具有相同文件名的文件,而不会对其子目录文件进行任何比较操作。

(二)diff实例

diff分析两个文件,并输出两个文件的不同的行。diff的输出结果表明需要对一个文件做怎样的操作之后才能与第二个文件相匹配(或者这么理解:与第一个文件相比,第二个文件发生了那些变化)。diff并不会改变文件的内容,但是diff可以输出一个ed脚本来应用这些改变。
假设有两个文件:file1.txt,file2.txt

cat file1.txt
I need to buy apples.
I need to run the laundry.
I need to wash the dog.
I need to get the car detailed.
cat file2.txt
I need to buy apples.
I need to do the laundry.
I need to wash the car.
I need to get the dog detailed.

我们使用diff比较他们的不同:

diff file1.txt file2.txt
2,4c2,4
< I need to run the laundry.
< I need to wash the dog.
< I need to get the car detailed.
---
> I need to do the laundry.
> I need to wash the car.
> I need to get the dog detailed.

结果说明:要明白diff比较结果的含义,我们必须牢记一点,diff描述两个文件不同的方式是告诉我们怎么样改变第一个文件之后与第二个文件匹配。我们看看上面的比较结果中的第一行 2,4c2,4 前面的数字2,4表示第一个文件中的行,中间有一个字母c表示需要在第一个文件上做的操作**(a=add,c=change,d=delete)**,后面的数字2,4表示第二个文件中的行。

2,4c2,4 的含义是:第一个文件中的第[2,4]行(注意这是一个闭合区间,包括第2行到第4行)需要做出修改才能与第二个文件中的[2,4]行相匹配。
接下来的内容则告诉我们需要修改的地方,前面带 < 的部分表示左边文件的第[2,4]行的内容,而带> 的部分表示右边文件的第[2,4]行的内容,中间的 — 则是两个文件内容的分隔符号。

(三) Normal模式

上面的部分我们说明了如何查看diff命令的结果,实际上对于上面的比较,我们使用的是diff命令的Normal模式,这也是diff命令的默认模式,也就是说diff两个文件的时候如果不加模式参数则是默认模式进行比较,其效果与(–normal)一样,

(四)Context模式

默认情况下的模式输出结果实际上是符合计算机的思维方式,不太直观,所以其输出结果并不能够很好的被人理解,diff命令除了默认模式之外还提供了另外两种模式,Context和Unified模式,本节我们说说如何查阅Context模式下的输出结果。diff命令应用Context模式只需要添加命令行参数 diff -c 即可,我们先看看两个案例文件:

diff -c file1.txt file2.txt 
*** file1.txt	2021-04-27 10:49:42.074232238 +0800
--- file2.txt	2021-04-27 10:50:05.241231533 +0800
***************
*** 1,4 ****
  I need to buy apples.
! I need to run the laundry.
! I need to wash the dog.
! I need to get the car detailed.
--- 1,4 ----
  I need to buy apples.
! I need to do the laundry.
! I need to wash the car.
! I need to get the dog detailed.

(五)Unified模式

diff还有一种比较方式,也即Unified模式,使用命令行 –u 来执行该模式的比较。其比较结果与Context模式很像,但是简化了一些输出,我们看看我们的案例文件,与上面的一样:

diff -u file1.txt file2.txt 
--- file1.txt	2021-04-27 10:49:42.074232238 +0800
+++ file2.txt	2021-04-27 10:50:05.241231533 +0800
@@ -1,4 +1,4 @@
 I need to buy apples.
-I need to run the laundry.
-I need to wash the dog.
-I need to get the car detailed.
+I need to do the laundry.
+I need to wash the car.
+I need to get the dog detailed.

可以看到其比较结果与Context模式实际上差不多,只不过将比较结果合并到一起了。

(六)比较目录

使用diff可以比较两个目录,其比较格式是 diff directory1 directory2 查看如下目录比较结果:

diff demo1 demo2
Only in demo1: file1.txt
Only in demo2: file2.txt
diff demo1/share.txt demo2/share.txt
1,3c1,3
< 111
< 222
< 333
---
> aaa
> bbb
> ccc

比较两个目录的时候无非是有的文件仅仅存在于某个目录中而在另一个目录中没有,如果存在同名的文件,则比较这两个文件的不同。diff比较目录的结果我们可以结合grep命令筛选出我们想要的输出,例如仅仅输出两个目录下不同的文件而忽略掉某一个目录独有另一个目录不存在的输出记录。

(七)ed脚本

脚本参数 -e 将比较的结果保存成一个ed脚本,之后ed程序可以执行该脚本文件,从而将file1修改成与file2的内容相同,这一般在patch的时候有用。

diff -e file1.txt file2.txt > script.txt

这样就是生成了一个ed可以执行的脚本文件script.txt,生成脚本文件之后我们还需要做一个操作, 在脚本文件末尾添加ed的write指令,只需要执行 echo “w” >>script.txt 将w指令附加到脚本文件的最后一行即可。
那么如何应用该脚本文件呢,可以这样使用:

ed  -  1.txt < script.txt 
[root@gitlab diff]# ed - file1.txt <script.txt 
[root@gitlab diff]# cat file1.txt 
I need to buy apples.
I need to do the laundry.
I need to wash the car.
I need to get the dog detailed.
[root@gitlab diff]# diff file1.txt file2.txt 
[root@gitlab diff]# 

注意中间的 – 符号表示从标准输入中读取,而 < script.txt 则重定向script.txt的内容到标准输入。这样执行之后file1.txt的内容将与file2.txt完全相同。

(八)diff 语法

  • diff(选项)(参数) 选项
    • <行数>:指定要显示多少行的文本。此参数必须与-c或-u参数一并使用;
    • a或——text:diff预设只会逐行比较文本文件;
    • b或–ignore-space-change:不检查空格字符的不同;
    • B或–ignore-blank-lines:不检查空白行;
    • c:显示全部内容,并标出不同之处;
    • C<行数>或–context<行数>:与执行“-c-<行数>”指令相同;
    • d或——minimal:使用不同的演算法,以小的单位来做比较;
    • D<巨集名称>或ifdef<巨集名称>:此参数的输出格式可用于前置处理器巨集;
    • e或——ed:此参数的输出格式可用于ed的script文件;
    • f或-forward-ed:输出的格式类似ed的script文件,但按照原来文件的顺序来显示不同处;
    • H或–speed-large-files:比较大文件时,可加快速度;
    • l<字符或字符串>或–ignore-matching-lines<字符或字符串>:若两个文件在某几行有所不同,而这几行同时都包含了选项中指定的字符或字符串,则不显示这两个文件的差异;
    • i或–ignore-case:不检查大小写的不同;
    • l或——paginate:将结果交由pr程序来分页;
    • n或——rcs:将比较结果以RCS的格式来显示;
    • N或–new-file:在比较目录时,若文件A仅出现在某个目录中,预设会显示:Only in目录,文件A 若使用-N参数,则diff会将文件A 与一个空白的文件比较;
    • p:若比较的文件为C语言的程序码文件时,显示差异所在的函数名称;
    • P或–unidirectional-new-file:与-N类似,但只有当第二个目录包含了第一个目录所没有的文件时,才会将这个文件与空白的文件做比较;
    • q或–brief:仅显示有无差异,不显示详细的信息;
    • r或——recursive:比较子目录中的文件;
    • s或–report-identical-files:若没有发现任何差异,仍然显示信息;
    • S<文件>或–starting-file<文件>:在比较目录时,从指定的文件开始比较;
    • t或–expand-tabs:在输出时,将tab字符展开;
    • T或–initial-tab:在每行前面加上tab字符以便对齐;
    • u,-U<列数>或–unified=<列数>:以合并的方式来显示文件内容的不同;
    • v或——version:显示版本信息;
    • w或–ignore-all-space:忽略全部的空格字符;
    • W<宽度>或–width<宽度>:在使用-y参数时,指定栏宽;
    • x<文件名或目录>或–exclude<文件名或目录>:不比较选项中所指定的文件或目录;
    • X<文件>或–exclude-from<文件>;您可以将文件或目录类型存成文本文件,然后在=<文件>中指定此文本文件;
    • y或–side-by-side:以并列的方式显示文件的异同之处;
      –help:显示帮助;
      –left-column:在使用-y参数时,若两个文件某一行内容相同,则仅在左侧的栏位显示该行内容;
      –suppress-common-lines:在使用-y参数时,仅显示不同之处。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

IForFree

整理不易,望多支持!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值