Git 的工作区、暂存区、版本库
大家都知道,在 Git 系统中有 “三棵树” 的概念。
注意:“树” 在这里的意思是 “文件集合”,而不是指特定的数据结构。
基本概念
树 | 用途 |
---|---|
HEAD(版本库) | 上一次提交的快照,下一次提交的父结点 |
Index(暂存区) | 预期的下一次提交的快照 |
Working Directory(工作区) | 沙盒 |
HEAD
HEAD
是当前分支引用的指针,它总是指向该分支上的最后一次提交。 这表示 HEAD
将是下一次提交的父结点。 通常,可以把 HEAD
看做你的上一次提交的快照。可以简单理解为: HEAD 指向分支(branch),分支指向提交。
Index
Index(索引,或暂存区)是你预期的下一次提交。这就是当你运行 git commit
时 Git 看起来的样子。Git 将上一次检出到工作目录中的所有文件填充到 Index,之后你会将其中一些文件替换为新版本,接着通过 git commit
将它们转换为树来用作新提交。
工作目录
另外两棵树以一种高效但并不直观的方式,将它们的内容存储在 .git
文件夹中。工作目录会将它们解包为实际的文件以便编辑。 你可以把工作目录当做 “沙盒”,在你将修改提交到暂存区并记录到历史之前,可以随意更改。
工作区、暂存区、版本库原理图
在这个图中,可以看到部分 Git 命令是如何影响工作区和暂存区的。
图中左侧为工作区,右侧为版本库。在版本库中标记为 index 的区域是暂存区。标记为master的是master分支所代表的目录树。
图中可以看出此时HEAD实际是指向master分支的一个“游标”。所以图示的命令中出现HEAD的地方可以用master来替换。
图中的 objects 标识的区域为 Git 的对象库,实际位于 .git/objects
目录下。
- 当对工作区修改(或新增)的文件执行
git add
命令时,暂存区的目录树被更新,同时工作区修改(或新增)的文件内容被写入到对象库中的一个新的对象中,而该对象的 ID 被记录在暂存区的文件索引中。 - 当执行提交操作
git commit
时,暂存区的目录树被写到版本库(对象库)中,master 分支会做相应的更新。即 master 最新指向的目录树就是提交时原暂存区的目录树。 - 当执行
git reset HEAD
命令时,暂存区的目录树会被重写,被 master 分支指向的目录树所替换,但是工作区不受影响。 - 当执行
git rm --cached <file>
命令时,会直接从暂存区删除文件(可以理解为取消跟踪),工作区则不做出改变。 - 当执行
git checkout -- <file>
命令时,会用暂存区指定的文件替换工作区的文件。这个操作很危险,会清除工作区中未添加到暂存区的改动。举例来说:命令git checkout -- readme.txt
意思就是把readme.txt
文件在工作区的修改全部撤销,这里有两种情况:一是readme.txt
自修改后还没有被放到暂存区,现在,撤销修改就回到和版本库一模一样的状态;一种是readme.txt
已经添加到暂存区,之后又作了修改,现在,撤销修改就回到添加到暂存区时的状态。 - 当执行
git checkout HEAD
或者git checkout HEAD <file>
命令时,会用 HEAD 指向的 master 分支中的全部或者部分文件替换暂存区和以及工作区中的文件。注意,前者对工作目录是安全的,Git 会通过检查来确保不会将已更改的文件弄丢;但是后者就危险了,也许会覆盖工作目录中对应的文件! - 当执行
git reset HEAD <file>
命令时,它本质上只是将 file 从 HEAD 复制到索引中(可以理解为“取消暂存文件” )。 - 当执行
git reset --hard HEAD
时,会用 HEAD 指向的 master 分支中的全部文件替换暂存区以及工作区中的文件。也就是说你撤销了最后的提交(git commit )、git add 和工作目录中的所有工作,这样做也是危险的,除非你真的想这么做。 - 也许你会问,
git reset --hard HEAD
和git checkout HEAD
这两个命令有什么区别呢?感觉它们干的事情差不多啊。其实还有很大区别的,具体可以参考我的博文 git checkout 和 git reset 的区别
参考资料
【1】 廖雪峰:https://www.liaoxuefeng.com/wiki/
【2】《Git 权威指南》
【3】《Pro Git》(Scott Chacon, Ben Straub Version 2.1.14, 2018-05-19)