1. Git是什么?
Git是一个免费的、开源的版本控制系统,是由Linux的作者Linus Torvalds在10天之内完成的。
2. Git能干什么?
还记得在改毕业论文时我们的每一版论文管理吧?
我们只能自己在本地进行管理。
是的,Git就是用来解决可以多人进行版本管理的工具,即为团队合作完成任务而研发的。
3. Git简介
Git是一种分布式版本控制系统,说到分布式那么肯定有集中式,下来就说明一下他们之间的区别。
(1)集中式版本控制系统(Centralized Version Control Systems,CVCS)
for example:CVS, subversion,Perforce, etc.
就是有一个集中管理的服务器,保存当前文档中的最新版本,各团队成员可以通过连接这台服务器来获取和提交文件,它被称为基于差异的版本控制(delta-based)。
优点:比本地版本控制有了很大改进,可以实现多人共同协作。
缺点:一旦服务器出现故障,一切玩完,其他人就没办法进展工作。
(2) 分布式版本控制系统(Distributed Version Control Systems,DVCS )
for example:Git、Mercurial、Bazaar,etc。
优点:
- 客户端并不只是提取最新版的文本快照,而是将代码仓库完整的镜像下来,包括完整的历史记录,这样任何一个服务器发生故障,都可以用任何一个镜像出来的本地仓库恢复,成功解决了集中式版本控制的缺点。
- 这种系统可以指定若干不同的远端代码仓库进行交互,因此。可以实现在同一个项目中,分别和不同团队的人相互协作。可以根据需要设定不同的协作流程。
(3)Git数据库
1)git中的术语
- 快照(snapshot):就是被追踪的最顶层的树,也就是一个文件夹 。Git记录了每个快照的parent,也就是当前这个文件夹的上一个版本。
- blob:单个的文件
- tree:一个文件夹
注:在Git中快照、blob和tree都是对象,可以被引用或者被搜索,会基于它们的SHA-1 hash
进行寻址。
git cat-file -t:查看每个SHA-1的类型
git cat-file -p:查看每个对象的内容和简单的数据结构
但是通过哈希值来搜索太不方便了,所以Git给出了一个引用reference。常见的HEAD就是一个特殊的引用。
本地库就是由对象和引用构成的,或者叫Repositories。
在硬盘上,Git只存储对象和引用,所有的Git命令都对应提交一个快照。
2)Git数据模型
class commit{
array<commit> parents
String author
String message
Tree snapshot
}
注:每个快照其实对应一次commit。
3)常用命令
Git的三个分区对应的三种状态:
工作区:本地写代码的地方,比如:vim或者IDE。—>对应的文件状态:modified,已修改,但还没保存到数据库。
暂存区:就是临时存放的地方。—>staged,Git已经对该文件做了标记,下次提交知道要包含它。
本地库:存放本地历史版本信息。—>commited,文件已经安全的存放在本地数据库中。