Git这个强大的版本管理系统

Git这个强大的版本管理系统,工作的时候默默注视着你的代码目录,所有的操作几乎都在.git目录中完成。今天我们来做一次git的观众,以便深入了解git的各个操作。 

首先,新建一个目录:git-monitor,进入目录后,用下面的命令初始化一个git仓库: 
Bash代码   收藏代码
  1. $> git init --bare git-monitor.git  

然后,创建一个工作目录wp1,意思为working_copy_1,进入该目录,运行git init,以创建.git目录。 

进入.git目录,会发现下列文件和目录: 
Bash代码   收藏代码
  1. HEAD        config      description hooks/       info/        objects/     refs/  

这些都是git的演员。我们当观众的,就从监控这些文件开始。但是演员分主角、配角,和跑龙套的,在这些文件中,config是配置文件,内容不会变的;hooks中的文件是一些回调程序的例子,删掉都没关系;description文件只为某些git的web应用提供描述信息。它们都是跑龙套的,剩下的文件和目录有: 
Bash代码   收藏代码
  1. HEAD        info/        objects/       refs/  

在后续的操作中,还有两位要上场,分别是index文件和logs目录,至此,主要演员表为: 
Bash代码   收藏代码
  1. HEAD        index       info/        objects/       refs/        logs/  

要用肉眼盯着它们看,实在不容易,于是我写了个ruby小程序(下载链接在最后),用于监控这些目录,一旦目录和文件有变化,就在控制台上向我们报告。我把这个程序放到.git目录下,并把它跑起来。接下来,好戏就开演了。 

回到wp1目录。新建一个文件file1.txt,然后看看监控程序,发现没有任何输出,说明git对刚才的操作没有响应。既然没反应,那我就接着操作,在file1.txt中加一行内容 
File1.txt代码   收藏代码
  1. content added by wp1, 1st time  

再看看监控,还是没有反应。看来,只要我们不调用git命令,它就不会有反应。那我就调一个看看: 
Bash代码   收藏代码
  1. $> git add .  

再看看监控,终于有反应了: 
Bash代码   收藏代码
  1. Created file: index  (in dir: git-monitor/wp1/.git)  
  2. Created file: c2/a04aa8cba9ba9a7a2fb8c9ecf74a3a0fc5e3fc  (in dir: git-monitor/wp1/.git/objects)  

git add这个命令,根据`man git-add`的解释,是把某个文件加入到index。这个index实际上就是工作目录下文件和目录状态的一个快照(stage),每一次git提交所产生的tree对象,就是依据index文件产生的(对index同志的详细采访,可以参考[url=http://progit.org/book/zh/ch9-2.html]这里[/url])。 

我们来看看产生的那个object到底是什么,根据git的规则,object的目录名加文件名,和起来是一个40字符的字符串,它是对文件内容进行SHA1 digest之后,用16进制编码得到的结果。此文件的内容是二进制的,要查看它,就要用下面的命令: 
Bash代码   收藏代码
  1. $> git cat-file -t c2a04aa8cba9ba9a7a2fb8c9ecf74a3a0fc5e3fc  
  2. blob  
  3. $> git cat-file -p c2a04aa8cba9ba9a7a2fb8c9ecf74a3a0fc5e3fc  
  4. content added by wp1, 1st time  

其中,-t这个参数是为了显示object类型,-p这个参数,是为了显示object的内容。显然,这个object就是刚才加进去的file1.txt,它是一个blob类型的对象,只存储文件内容和长度。 

接下来,我把这次添加的内容提交一下(git commit -m 'commit by wp1, 1st time'),再看看监控,又有输出了,这次的内容还真丰富啊: 
Bash代码   收藏代码
  1. Changed file: index  
  2. Created file: 16/71ae856c149673436da08f1ba026469c3a918d  (in dir: git-monitor/wp1/.git/objects)  
  3. Created file: 30/c64c3a55b02f4c251565ef057d402f84751b56  (in dir: git-monitor/wp1/.git/objects)  
  4. Created file: heads/master  (in dir: git-monitor/wp1/.git/refs)  
  5. Created file: HEAD  (in dir: git-monitor/wp1/.git/logs)  
  6. Created file: refs/heads/master  (in dir: git-monitor/wp1/.git/logs)  

首先,我们发现index文件被改变了。但是,经过我仔细比对两次的index文件的二进制字节码后发现,它的内容并没有改变,所以可能是它的修改时间发生了改变。对此我想说的是:请高人指点! 

再看后面新生成的两个文件,用我们上面的办法看看内容: 
Bash代码   收藏代码
  1. $> git cat-file -p 1671ae856c149673436da08f1ba026469c3a918d  
  2. tree 30c64c3a55b02f4c251565ef057d402f84751b56  
  3. author Kevin Fu <corntrace@email.com> 1281230735 +0800  
  4. committer Kevin Fu <corntrace@email.com> 1281230735 +0800  
  5.   
  6. commit by wp1, 1st time  
  7.   
  8. $> git cat-file -p 30c64c3a55b02f4c251565ef057d402f84751b56  
  9. 100644 blob c2a04aa8cba9ba9a7a2fb8c9ecf74a3a0fc5e3fc    file1.txt  

显然,第一个文件是个commit对象,第二个文件是个tree对象,从引用关系来看,是先生成的tree对象,再生成的commit对象。注意,这个commit对象没有parent引用。 

再看看后面生成的refs,用git show-refs可以查看所有refs的内容 
Bash代码   收藏代码
  1. $> git show-refs  
  2. 1671ae856c149673436da08f1ba026469c3a918d refs/heads/master  

master当然指的是master分支,它的值指向刚才看到的commit对象 

最后就是两个log文件。log文件虽然只是供人查看,但在git中的地位非同一般。先看看其内容: 
Bash代码   收藏代码
  1. $ cat logs/HEAD  
  2. 0000000000000000000000000000000000000000 1671ae856c149673436da08f1ba026469c3a918d Kevin Fu <corntrace@email.com> 1281230735 +0800 commit (initial): commit by wp1, 1st time  
  3.   
  4. $ cat logs/refs/heads/master  
  5. 0000000000000000000000000000000000000000 1671ae856c149673436da08f1ba026469c3a918d Kevin Fu <corntrace@email.com> 1281230735 +0800 commit (initial): commit by wp1, 1st time  

可以看到,这两个文件的内容目前是一样的。这个文件记录了什么呢?它记录的是工作目录的状态变化。其中,那一串0表示,一起是从零开始的,因为git在初始化工作目录时,并没有创建任何对象,要表示初始状态,只好用40个0来表示了。后面那串,就是指向刚才的本次的commit对象。这条记录解释出来,就是:在1281230735 +0800时刻,由Kevin Fu做了一次提交,工作目录从初始状态,转到commit 1671ae8对应的状态。 

这个时候,用过git的人可能会生疑问:用git log看到的输出不是这个样子的呀。说对了,git log的输出,并不是由这里的log文件产生的,我认为,它的内容是根据commit之间的关联关系,实时计算并显示出来的。而这里的logs,是git中的reflog,用git reflog命令可以查看: 
Bash代码   收藏代码
  1. $> git reflog  
  2. 1671ae8 HEAD@{0}: commit (initial): commit by wp1, 1st time  

这个内容,就跟上面的对应上了吧。为什么说这个log文件很重要呢?因为在git中,objects其实都是死的,绝大多数情况下,一旦创建就不会被修改,也不会被删除;当版本控制的内容发生变化时,只有新的objects被创建出来,没有旧的objects被改变。那么一堆死东西,如何实现灵活的版本变化呢?第一个就是靠不断变化的版本指针,比如HEAD以及refs/heads/master文件,第二个,就是靠记录工作目录变化情况的日志文件。有了日志文件,你想查看谁就查看谁,想往哪个版本跳就往哪个版本跳,想合并谁就合并谁。许多git命令,都是基于这个思想而设计的。 


接下来,我再添加一个文件file2.txt,但不是在master branch中,而是新开一个branch: advanced,我们看看开分支的时候,监控有何变化: 
Bash代码   收藏代码
  1. $> git checkout -b advanced  
  2. (monitor outputs)  
  3. Changed file: index  
  4. Changed file: HEAD  
  5. Created file: heads/advanced  (in dir: /Users/corntrace/git-monitor/wp1/.git/refs)  
  6. Created file: refs/heads/advanced  (in dir: /Users/corntrace/git-monitor/wp1/.git/logs)  
  7. Changed file: HEAD  (in dir: /Users/corntrace/git-monitor/wp1/.git/logs)  

除去那个index文件的变化,看看其他的文件。首先是HEAD文件,其内容变成了:refs/heads/advanced,说明HEAD已经移到了advanced分支上。再看看新产生的refs/heads/advanced文件: 
Bash代码   收藏代码
  1. $> git show-ref  
  2. 1671ae856c149673436da08f1ba026469c3a918d refs/heads/advanced  
  3. 1671ae856c149673436da08f1ba026469c3a918d refs/heads/master  

可见目前它与master分支指向同一个commit。再来看看两个日志文件: 
Bash代码   收藏代码
  1. $ cat logs/HEAD  
  2. 0000000000000000000000000000000000000000 1671ae856c149673436da08f1ba026469c3a918d Kevin Fu <corntrace@email.com> 1281230735 +0800 commit (initial): commit by wp1, 1st time  
  3. 1671ae856c149673436da08f1ba026469c3a918d 1671ae856c149673436da08f1ba026469c3a918d Kevin Fu <corntrace@email.com> 1281236136 +0800 checkout: moving from master to advanced  

它果然把我的一举一动都记录下来了。在第二条记录里,两个sha1值是一样的,说明没有提交,只有指针的创建或改变。 
再看看另一个log: 
Bash代码   收藏代码
  1. 0000000000000000000000000000000000000000 1671ae856c149673436da08f1ba026469c3a918d Kevin Fu <corntrace@email.com> 1281236136 +0800 branch: Created from HEAD  

它说明了advanced分支是从零开始,转到commit 671ae8的。看来它一点都不含糊啊。 

现在,我增加文件file2.txt,并添加以下内容,但分两次提交:第一次提交前两行,第二次提交后两行 
File2.txt代码   收藏代码
  1. content added by wp1, 1st time  
  2. additional content added by wp1, 1st time too  
  3.   
  4. # TODO: implement a feature  
  5. # I plan to do ...  

显然,第一次提交将会产生3个objects:一个commit对象,一个file2.txt的blob对象,还有一个tree对象,另外,refs/heads/advanced会指向目前的这个commit对象,然后两个log文件(logs/HEAD和logs/refs/heads/advanced)会添加一些内容,我全部列在这里: 
Bash代码   收藏代码
  1. $> git show-ref  
  2. 35ba29ec8f31d5372b75d7be6b1ec7f03c0fb666 refs/heads/advanced  
  3. 1671ae856c149673436da08f1ba026469c3a918d refs/heads/master  
  4.   
  5. $> git cat-file -p 35ba29ec8f31d5372b75d7be6b1ec7f03c0fb666  
  6. tree 9c1c4549a869ede4d5f85c93594c1c23c311122f  
  7. parent 1671ae856c149673436da08f1ba026469c3a918d  
  8. author Kevin Fu <corntrace@email.com> 1281251100 +0800  
  9. committer Kevin Fu <corntrace@email.com> 1281251100 +0800  
  10.   
  11. commit by wp1 for file2.txt, 1st time  
  12.   
  13. $> git cat-file -p 9c1c4549a869ede4d5f85c93594c1c23c311122f   
  14. 100644 blob c2a04aa8cba9ba9a7a2fb8c9ecf74a3a0fc5e3fc    file1.txt  
  15. 100644 blob baa4a1630ce88a9198b5eda885884aadab795806    file2.txt  
  16.   
  17. $> git cat-file -p baa4a1630ce88a9198b5eda885884aadab795806   
  18. content added by wp1, 1st time  
  19. additional content added by wp1, 1st time  
  20.   
  21. $> cat logs/HEAD  
  22. 0000000000000000000000000000000000000000 1671ae856c149673436da08f1ba026469c3a918d Kevin Fu <corntrace@email.com> 1281230735 +0800 commit (initial): commit by wp1, 1st time  
  23. 1671ae856c149673436da08f1ba026469c3a918d 1671ae856c149673436da08f1ba026469c3a918d Kevin Fu <corntrace@email.com> 1281236136 +0800 checkout: moving from master to advanced  
  24. 1671ae856c149673436da08f1ba026469c3a918d 35ba29ec8f31d5372b75d7be6b1ec7f03c0fb666 Kevin Fu <corntrace@email.com> 1281251100 +0800 commit: commit by wp1 for file2.txt, 1st time  
  25.   
  26. $> cat logs/refs/heads/advanced  
  27. 0000000000000000000000000000000000000000 1671ae856c149673436da08f1ba026469c3a918d Kevin Fu <corntrace@email.com> 1281236136 +0800 branch: Created from HEAD  
  28. 1671ae856c149673436da08f1ba026469c3a918d 35ba29ec8f31d5372b75d7be6b1ec7f03c0fb666 Kevin Fu <corntrace@email.com> 1281251100 +0800 commit: commit by wp1 for file2.txt, 1st time  

可以看到,这次的commit对象中多了parent的引用,就是指向上一次的commit。 
接下来我提交第二部分的内容,其结果与刚才的分析相似,就不写了。提交之后,我转回master分支,将advanced分支中的内容合并进来,然后将master分支推送出去,我就可以下班了。 

我们看看转回master分支时,监控都有哪些输出: 
Bash代码   收藏代码
  1. Changed file: index  
  2. Changed file: HEAD  
  3. Changed file: HEAD  (in dir: /Users/corntrace/git-monitor/wp1/.git/logs)  

可见,除了那个index文件,HEAD文件的内容被该为:ref: refs/heads/master,logs/HEAD文件中添加了一行记录分支跳转的日志。 

接下来我运行git merge advanced。合并完成后,看看监控的输出: 
Bash代码   收藏代码
  1. Changed file: index  
  2. Changed file: heads/master  (in dir: /Users/corntrace/git-monitor/wp1/.git/refs)  
  3. Changed file: HEAD  (in dir: /Users/corntrace/git-monitor/wp1/.git/logs)  
  4. Changed file: refs/heads/master  (in dir: /Users/corntrace/git-monitor/wp1/.git/logs)  

这里列出后三项的内容: 
Bash代码   收藏代码
  1. $> git show-ref  
  2. 8227ae64f1f651669c6445d4c37909c8443df209 refs/heads/advanced  
  3. 8227ae64f1f651669c6445d4c37909c8443df209 refs/heads/master  
  4.   
  5. $> cat logs/HEAD  
  6. (猜都能猜出来,就省了吧)  
  7.   
  8. $> cat logs/refs/heads/master  
  9. 0000000000000000000000000000000000000000 1671ae856c149673436da08f1ba026469c3a918d Kevin Fu <corntrace@email.com> 1281230735 +0800 commit (initial): commit by wp1, 1st time  
  10. 1671ae856c149673436da08f1ba026469c3a918d 8227ae64f1f651669c6445d4c37909c8443df209 Kevin Fu <corntrace@email.com> 1281252267 +0800 merge advanced: Fast-forward  

从分支的指向可以看到,它指到advanced分支对应的commit上去了;从logs的内容可以看到,本次的操作称为merge advanced: Fast-forword。除此之外,并没有产生任何object,连commit都没有,这是因为在合并之后,git分析出当前的目录树结构与advanced分支中的目录树是一样的,所以只是简单的把master的指针指向advanced分支。 

OK,在下班之前,我还是要看看master分支中的代码,确保没有什么坏代码被交上去。但是,我的神,file2.txt中有一个TODO,这要是被老板看见了,还不要我晚上加班啊!我能把它删掉再提交吗?不能啊,老板要是往回看一个版本,不就找出来了!因此,当务之急就是,把master的版本指针退回去,让它指向原来的1671ae8这个版本。git reset这个命令可以帮到我。 
Bash代码   收藏代码
  1. $> git reset --hard 1671ae8  
  2. (monitor outputs)  
  3. Changed file: index  
  4. Changed file: heads/master  (in dir: /Users/corntrace/git-monitor/wp1/.git/refs)  
  5. Changed file: HEAD  (in dir: /Users/corntrace/git-monitor/wp1/.git/logs)  
  6. Changed file: refs/heads/master  (in dir: /Users/corntrace/git-monitor/wp1/.git/logs)  
  7.   
  8. $> git show-ref  
  9. 8227ae64f1f651669c6445d4c37909c8443df209 refs/heads/advanced  
  10. 1671ae856c149673436da08f1ba026469c3a918d refs/heads/master  
  11.   
  12. $> cat logs/refs/heads/master  
  13. 0000000000000000000000000000000000000000 1671ae856c149673436da08f1ba026469c3a918d Kevin Fu <corntrace@email.com> 1281230735 +0800 commit (initial): commit by wp1, 1st time  
  14. 1671ae856c149673436da08f1ba026469c3a918d 8227ae64f1f651669c6445d4c37909c8443df209 Kevin Fu <corntrace@email.com> 1281252267 +0800 merge advanced: Fast-forward  
  15. 8227ae64f1f651669c6445d4c37909c8443df209 1671ae856c149673436da08f1ba026469c3a918d Kevin Fu <corntrace@email.com> 1281253859 +0800 1671ae8: updating HEAD  

可以看到,master的head是真的退回去了,reflog中的记录,稍候再说。现在只要把advanced中想要的那个提交弄过来,就万事大吉了。git cherry-pick这个命令这是用来做这个的。 
Bash代码   收藏代码
  1. $> git cherry-pick --ff 35ba29e  
  2. (此时这里居然没有任何输出,git的作者们太高估用户了!来看看monitor outputs)  
  3. Changed file: index  
  4. Changed file: heads/master  (in dir: /Users/corntrace/git-monitor/wp1/.git/refs)  
  5. Changed file: HEAD  (in dir: /Users/corntrace/git-monitor/wp1/.git/logs)  
  6. Changed file: refs/heads/master  (in dir: /Users/corntrace/git-monitor/wp1/.git/logs)  
  7.   
  8. $> git show-ref  
  9. 8227ae64f1f651669c6445d4c37909c8443df209 refs/heads/advanced  
  10. 35ba29ec8f31d5372b75d7be6b1ec7f03c0fb666 refs/heads/master  
  11.   
  12. $> cat file2.txt  
  13. content added by wp1, 1st time  
  14. additional content added by wp1, 1st time  

看,TODO果然是没有了!在这里我用的--ff参数,是要告诉git,只需要做fast-forword就可以了,因为35ba29e这个commit的parent,正是先前的master的head(1671ae8)。 

OK,我可以把master分支推送到远程仓库里去了。在推之前,我需要把远程仓库加进来。这里我就用一个本地的仓库来代替远程的吧。 
Bash代码   收藏代码
  1. $> git remote add origin /path/to/git-monitor.git  
  2. (这一步monitor无输出)  
  3.   
  4. $> git push origin master  
  5. (monitor outputs)  
  6. Created file: remotes/origin/master  (in dir: /Users/corntrace/git-monitor/wp1/.git/refs)  
  7. Created file: refs/remotes/origin/master  (in dir: /Users/corntrace/git-monitor/wp1/.git/logs)  
  8.   
  9. $> git show-ref  
  10. 8227ae64f1f651669c6445d4c37909c8443df209 refs/heads/advanced  
  11. 35ba29ec8f31d5372b75d7be6b1ec7f03c0fb666 refs/heads/master  
  12. 35ba29ec8f31d5372b75d7be6b1ec7f03c0fb666 refs/remotes/origin/master  
  13.   
  14. $> cat logs/refs/remotes/origin/master  
  15. 0000000000000000000000000000000000000000 35ba29ec8f31d5372b75d7be6b1ec7f03c0fb666 Kevin Fu <corntrace@email.com> 1281255166 +0800 update by push  

可见,这一步的操作就是新建了一个remote master分支的ref,然后添加了一个logs文件。看来所有的事情都办妥了,那就下班吧。 

但是老板还没有下班,而是正准备做code review。他把代码checkout下来: 
Bash代码   收藏代码
  1. $> git co /path/to/git-monitor.git && cd git-monitor  
  2. $> git reflog  
  3. 35ba29e HEAD@{0}: clone: from /Users/corntrace/git-monitor/git-monitor.git  

他的reflog文件中,完全没有我刚才操作的内容。看来,git是不会提交reflog到仓库中的。 

OK,写到这里,今天的git剧就要谢幕了。相关文件在后面下载,大家可以重播。如果你有使用git的好的case,也可以分享给大家,Thank you! 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值