Git 版本库设计原理

2.2 版本库的设计原理

上一节介绍了版本库的概念,这一节介绍工作空间与版本库中是如何进行交互的。通过揣摩作者是如何设计 Git 的,来确定我们学习 Git 究竟要学习哪些东东。

1. 将文件添加到版本库

假设你已经按照 2.1 节创建了版本库,管理的目录为 d:\git-demo。

接下来先跟着操作一遍,有疑惑先放着,下面会根据这个例子来介绍具体过程是如何操作的。

  • 在 git-demo 目录下新建文件 readme.txt

    内容如下:(d:\git-demo\readme.txt)

    create a readme.txt file.
    
  • 打开 dos 窗口切换到 git-demo 目录下

    $ cd d:\git-demo
    
  • 输入 git status 查看状态

    状态值:Untracked files,表示这是一个新增的文件。

    status1

  • 将 readme.txt 添加到版本库

    $ git add readme.txt
    
  • 输入 git status 查看状态

    状态值:Changes to be commited,表示版本库已经知道了工作空间被修改了。

    status2

  • 将 readme.txt 提交到版本库

    $ git commit -m "add a readme.txt file"
    
  • 输入 git status 查看状态

    状态值:nothing to commit,表示工作空间的修改已经作为一个版本放到了版本库。

    status3

  • 修改 readme.txt 文件,内容如下:(d:\git-demo\readme.txt)

    create a readme.txt file.
    This is the second revision of the document.
    
  • 输入 git status 查看状态

    状态值:Changes not staged for commit,表示版本库知道文件被修改了,只是还没有提交。

    status4

2. git 设计原理

通过上面的例子,我们有理由推测 git 在添加/修改文件到版本库中是这样操作的:

  • 首先通过 git add 指令将工作区中的内容添加到暂存区;
  • 再通过 git commit 指令将暂存区中内容添加到版本库中。

版本库设计原理图

  • 相关概念说明:
    • 工作区:git-demo 目录(除了 .git 目录以外)可以认为是工作空间
    • 版本库:.git 目录可以认为是版本库,其中版本库中包含两个东东
      • stage:叫做暂存区
      • master:分支,也就是真正意义上存放版本的仓库了

看到上图我们不禁会想:为什么 git 的作者在设计时不直接将工作区中修改的文件直接添加到master版本库中,而要在中间再加一层 stage 暂存区呢?

dk 想了又想,再次做出推测:

抽象成思维导图就是像下面这样的:

git 是如何设计的

这里纠正一个错误,将 master 版本库替换成 master 分支仓库更合适。

寄快递对比图

对比上面两张思维导图,可得出如下结论:

  • 如果小明寄快递到代收点,代收点马上就将快递送到快递公司;小红紧接着又将快递寄到代收点,代收点再次送到快递工资;与代收点在一天内收到小明、小红、小花的快递,在晚上的时候一并将快递送到快递公司。哪种看起来更好不言而喻。

  • 版本库,作为一个仓库保存着不同版本的信息,如果每一次小修改都打一条版本信息放到版本库,那无疑会大大增加版本库的容量。最佳实践时将一定时间内的所有修改作为一条版本放到版本库中最节约资源。

  • 如果小明寄快递到代收点,后来发现东西记错了,想要取回来,直接去代收点拿回来就可以了。如果没有代收点,小明的快递直接寄到快递公司,被快递公司放到了大货车上就不是那么容易拿回来了。放到版本库中的暂存区也就是方便你撤销你的修改。

现在再回过头来看看 1 中示例代码,是不是对整个流程知根知底了,对工作区,暂存区和版本库的概念也大致熟悉了。如果不熟悉,请将本节重新阅读一遍。

3. 暂存区管理的是修改,不是文件

老的版本控制系统比如 svn,管理的是文件,也就是你每一次将本地代码提交到仓库时,实际上提交的都是文件,而文件如果一多,就会导致同步速度很慢。(使用过 svn 的应该有感受)

Git 的作者考虑到这一点,舍弃了管理文件的思想,使用管理修改的新新思想,这也就是为什么使用 Git 速度很快的原因。

举例说明:

  • 在 git-demo 目录下新建 test.txt 文件

    内容如下:(d:\git-demo\test.txt)

    this is a test.txt file.
    
  • 将 test.txt 文件添加到暂存区

    $ git add test.txt
    
  • 修改 test.txt 文件

    内容如下:

    this is a test.txt file.
    This is the second revision of the document.
    
  • 将 test.txt 文件提交到分支仓库

    $ git commit -m "add test.txt"
    
  • 使用 git status 查看状态

    $ git status
    

    管理的是修改

我们明明 commit 了 test.txt 文件,为什么还显示有东西要提交呢?

我们来分析一下这个过程:

管理的是修改

  • 在示例代码中,第一次新增 test.txt 文件后使用 git add 把它放到了暂存区中;

  • 第二次修改 test.txt 文件后并没有添加暂存区而直接使用 git commit 操作将暂存区中内容提交到分支仓库中。

  • 因此,使用 git status 时可以看到仍然有一个修改,提示值:"Changes not staged for commit"也可以看出有个修改没有放到暂存区中,stated 就是暂存区的意思。

  • 如果管理的是文件,在使用 git commit 时应该就将 test.txt 文件直接添加到版本库中。使用管理修改而不管理文件的目的是让这个过程变得更快,因为修改可以是一段描述性的字符串即可。

4. Git 我们主要学些什么

经过上面的学习,我们知道使用版本控制就是将本地工作区的代码在分支仓库中进行备份,而我们关心的操作就是如何从本地到暂存区到分支仓库这一条流水线的正常工作。

git 要学什么

本节我们已经学习过在这条流水线上新增操作了,在接下来的章节将学习撤销操作与删除操作。

当然,上述三种操作可以看成是将文件塞到分支仓库,那么从分支仓库中将备份取出来也至关重要,因此,我们还要学习如何回滚版本库中指定备份。

5. 总结

  • 本节介绍了 Git 的设计原理

    主要要掌握工作区、暂存区与分支版本库的概念。

  • 根据设计原理确定接下来的学习路线

    • 将本地代码备份到分支仓库流水线:工作区 - 暂存区 - 分支仓库;

    • 已经介绍过新增操作,通过 git add 添加到暂存区,通过 git commit 提交到分支仓库;

    • 接下来学习撤销操作和删除操作。

  • 介绍了暂存区时管理修改而不是管理文件

    这一点没看懂的拉上去再看一遍

  • 学习到了三个指令

    • git add <filename>

      提交工作区中文件到暂存区

    • git commit -m <descrption>

      将暂存区中所有修改提交到分支仓库中;

      -m 后面紧跟着的是对当前版本的一段描述话语,方便以后再分支仓库中快速找到某个版本;

      注意:这里要用双引号,不能用单引号。

    • git status

      查看文件/目录在 git-demo 目录下的状态,好比收快递时查的物流信息一样。

      文件在版本库中的位置

转载于:https://my.oschina.net/dkvirus/blog/1155172

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值