Git对象模型

一、SHA

所有用来表示项目历史信息的文件,都是通过一个40个字符串的(40-digit)“对象名”来索引的,例如“6ff87c4664981e4397625791c8ea3bbb5f2279a3”。对象名的前两位为版本库中object文件夹下子文件夹的名称,后面38位为该子文件夹下具体的文件名称,子文件夹名称+文件名组成唯一的对象名称,如下图所示:

                  

每一个“对象名”都是对“对象”内容做SHA1哈希计算得来的(SHA1是一种密码学的哈希算法),这样就意味着两个不同的对象不可能有相同的“对象名”,而两个相同的内容的对象,不论是否在同一个版本库中,它们的对象名都是一样的,因为它们的内容相同。

Git采用这种对“对象”内容做SHA1算法的好处在于:①Git只需要比较对象名,就能判断两个对象是否相同。②通过检查某个对象内容的SHA1哈希值和该对象现有的“对象名”进行比较就能判断该对象的内容是否正确。③因为在每个版本库中对象的命名方法都一样,所以相同内容的对象不论存放在哪个仓库下,它们的对象名都一样。

二、Git的一个重要理念

Git与我们熟悉的大部分版本控制系统的差别是很大的。也许我们熟悉Subversion、CVS、Perforce、Mercurial等等,他们使用“增量文件系统”,也就是说它们只会存储每次提交时文件与版本库中文件差异的部分。而Git正好相反,它会把我们每次提交文件的全部内容记录下来。

三、Git对象

Git系统中有四种类型的对象,每个对象包含三个部分,分别是:类型、大小和内容,对象的大小取决于内容的大小,而内容的大小则取决于对象的类型。几乎所有Git操作都是在这四种Git对象上进行的,所以了解这四种对象的作用对于应用Git有很大帮助,这四种对象是:

(1)“blob”:一个“blob”通常用来存储文件的内容。一个“blob”对象就是一块二进制数据,它没有指向任何东西或有任何其它属性,甚至没有文件名。因为“blob”对象内容全部都是数据,所以如两个文件在一个目录树或是一个版本仓库中有同样的数据内容,那么它们将会共享同一个“blob”对象。“blob”对象和其所对应的文件所在路径、文件名是否改被更改都完全没有关系。我们可以使用“git show 对象名(对象名不用输入全部40位字符串,输入部分即可)”来查看一个blob对象的内容,如下图所示:

$ git show 6ff87c4664
Note that the only valid version of the GPL as far as this project
is concerned is _this_ particular version of the license (ie v2, not
v2.2 or v3.x or whatever), unless explicitly otherwise stated.
...

(2)“tree”:像一个目录,管理一些“tree”对象或是“blob”对象。它有一串指向“blob”对象或是其它“tree”对象的指针,一般用来表示内容之间的目录层次关系(就像文件和子目录)。我们可以使用“git show 对象名”来查看一个tree对象,但是为了看到更多细节的东西,我们可以使用“git ls -tree 对象名(对象名不用输入全部40位字符串,输入部分即可)”来查看,如下图所示:

$ git ls-tree fb3a8bdd0ce
100644 blob 63c918c667fa005ff12ad89437f2fdc80926e21c    .gitignore
100644 blob 5529b198e8d14decbe4ad99db3f7fb632de0439d    .mailmap
100644 blob 6ff87c4664981e4397625791c8ea3bbb5f2279a3    COPYING
040000 tree 2fb783e477100ce076f6bf57e4a6f026013dc745    Documentation
100755 blob 3c0032cec592a765692234f1cba47dfdcc3a9200    GIT-VERSION-GEN
100644 blob 289b046a443c0647624607d471289b2c7dcd470b    INSTALL
100644 blob 4eb463797adc693dc168b926b6932ff53f17d0b1    Makefile
100644 blob 548142c327a6790ff8821d67c2ee1eff7a656b52    README

如上所示:一个tree对象包括一串条目,每一个条目包括:mode(mode位都是644 或 755,这意味着Git只关心文件的可执行位.)、对象类型、对象名和文件名字。它用来表示一个目录树的内容。

一个tree对象可以指向一个包含文件内容的blob对象,也可以是包含某个子目录内容的其它tree对象。“tree”对象、“blob”对象和其它所有的对象一样,都用其内容的SHA1哈希值来命名的;只有当两个tree对象的内容完全相同(包括其所指向所有子对象)时,它的名字才会一样,反之亦然。这样就能让Git仅仅通过比较两个相关的tree对象的名字是否相同,来快速的判断其内容是否不同。在有些情况下,“tree”对象也可以指向“commit”对象。

(3)“commit”:一个“commit”对象只指向一个“tree对象”,并且带有相关的描述信息,标记项目某一个特定时间点的状态。它包括一些关于时间点的元数据,如时间戳、最近一次提交的作者、指向上次提交的指针等等。我们可以使用“git show 对象名”来查看一个commit对象,但是为了看到更多细节的东西,我们通常会使用“git show -s --pretty=raw 对象名(对象名不用输入全部40位字符串,输入部分即可)”命令来查看,如下图所示:

$ git show -s --pretty=raw 2be7fcb476
commit 2be7fcb4764f2dbcee52635b91fedb1b3dcf7ab4
tree fb3a8bdd0ceddd019615af4d57a53f43d8cee2bf
parent 257a84d9d02e90447b149af58b271c19405edb6a
author Dave Watson <dwatson@mimvista.com> 1187576872 -0400
committer Junio C Hamano <gitster@pobox.com> 1187591163 -0700

    Fix misspelling of 'suppress' in docs

    Signed-off-by: Junio C Hamano <gitster@pobox.com>

可以看到,一个提交(commit)由以下的部分组成:①一个“tree”对象:“tree”对象的SHA1签名,代表着目录在某一时间点的内容。②父对象(parent(s)):提交的SHA1签名代表着当前提交前一步的项目历史。上面的那个例子就只有一个父对象;合并的提交(merge commits)可能会有不只一个父对象。如果一个提交没有父对象,那么我们就叫它“根提交”(root commit),它就代表着项目最初的一个版本(revision)。每个项目必须有至少有一个“根提交”(root commit)。一个项目可能有多个“根提交”,虽然这并不常见。③作者:做了此次修改的人的名字,还有修改日期。④提交者(committer):实际创建提交(commit)的人的名字,同时也带有提交日期。可能会和作者不是同一个人;例如作者写一个补丁(patch)并把它用邮件发给提交者, 由他来创建提交(commit)。⑥注释:用来描述此次提交。

一个提交本身并没有包括任何信息来说明其做了哪些修改;所有的修改(changes)都是通过与父提交(parents)的内容比较而得出的。尽管git可以检测到文件内容不变而路径改变的情况,但是它不会去显式(explicitly)记录文件的更名操作。

一般用git commit来创建一个提交(commit), 这个提交的父对象一般是当前分支(current HEAD),同时把存储在当前索引(index)的内容全部提交。

此时,我们已经了解了三种对象模型,现在我们来看看这三种队形模型是怎么组合到一起的。例如我们有一个项目,结构如下图所示:

如果我们把它提交(commit)到一个Git仓库中, 在Git中“blob”、“commit”和“tree”对象的关系看起来会如下图:

可以看到: 每个目录都创建了“tree”对象, 每个文件都创建了一个对应的“blob”对象。最后有一个“commit”对象来指向根“tree”对象,这样我们就可以追踪项目每一项提交内容。 

(4)“tag”:一个“tag”对象包括一个对象名(SHA1签名)、对象类型、标签名、标签创建人的名字(“tagger”), 还有一条可能包含有签名(signature)的消息。我们可以使用“git cat -file tag 对象名(对象名不用输入全部40位字符串,输入部分即可)”来查看一个标签对象的信息,如下图所示:

$ git cat-file tag v1.5.0
object 437b1b20df4b356c9342dac8d38849f24ef44f27
type commit
tag v1.5.0
tagger Junio C Hamano <junkio@cox.net> 1171411200 +0000
GIT 1.5.0
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.6 (GNU/Linux)
iD8DBQBF0lGqwMbZpPMRm5oRAuRiAJ9ohBLd7s2kqjkKlq1qqC57SbnmzQCdG4ui
nLE/L9aUXdWeTFPron96DLA=
=2E+0
-----END PGP SIGNATURE-----

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值