本人在“若泽大数据”学习的基础课程基本结束,但在写此文章时,还有部分基础课程没有整理博客!后续将逐渐将基础部分博客整理完善。
下面开启在“若泽大数据”学习之高级班的课程,在学习前需要对git版本管理控制系统做一个学习及总结,为后续大数据学习中的代码管理做好准备
一、Git的历史
Linux 内核开源项目有着为数众广的参与者。绝大多数的 Linux 内核维护
工作都花在了提交补丁和保存归档的繁琐事务上(1991-2002 年间)。到 2002
年,Linux 系统已经发展了十年了,代码库之大让 Linus 很难继续通过手工方式
管理了,于是整个项目组开始启用分布式版本控制系统 BitKeeper 来管理和维
护代码。
到 2005 年的时候,开发 BitKeeper 的商业公司同 Linux 内核开源社区的
合作关系结束(为什么结束大家可以自己百度查一查,也是有故事的),他们收
回了免费使用 BitKeeper 的权力。这就迫使 Linux 开源社区(特别是 Linux
的缔造者 Linus Torvalds )不得不吸取教训,只有开发一套属于自己的版本控
制系统才不至于重蹈覆辙。他们对新的系统订了若干目标:
1. 速冻
2. 简单的设计
3. 对非线性开发的强力支持(允许上千个并行开发的分支)
4. 完全分布式
5. 有能力高效管理类似Linux内核一样超大规模的项目(速度和数据量)
二、Git与SVN对比
-
SVN
SVN是集中式版本控制系统,版本库是hi集中存放在中央服务器的而干活的时候,用的都是自己的电脑,所以首先要从中央服务器那里得到最新的版本,然后干活,干完活后需要把自己做完的活推送到中央服务器。集中式版本控制系统是必须联网才能工作,如果在局域网还可以,带宽够大,速度够快,如果在互联网,网速还慢,就郁闷了
集中管理方式在一定程度上看到其他开发人员在干什么,而管理员也可以很轻松掌握每个人的开发权限。
但是相较于其优点而言,集中式版本控制工具缺点很明显:- 服务器单点故障
- 容错性差
-
Git
Git 是分布式版本控制系统,那么它可以没有中央服务器的,每个人的电脑就是一个完整的版本库,这样,工作的时候就不需要联网了,因为版本都是在自己的电脑上。既然每个人的电脑都有一个完整的版本库,那多个人如何协作呢?比如说自己在电脑上改了文件 A,其他人也在电脑上改了文件 A,这时,你们两之间只需把各自的修改推送给对方,就可以互相看到对方的修改。
下图就是分布式版本控制工具管理方式
三、Git工作流程图
- 从远程仓库中克隆 Git 资源作为本地仓库。
- 从本地仓库中 checkout 代码然后进行代码修改
- 在提交前先将代码提交到暂存区。
- 提交修改。提交到本地仓库。本地仓库中保存修改的各个历史版本。
- 在修改完成后,需要和团队成员共享代码时,可以将代码 push 到远程
四、Git的安装
- 安装Git
- 下载地址
官网地址:https://git-scm.com/
下载地址:https://git-scm.com/downlo
双击下载好的exe安装程序,一直默认下一步即可 - 安装 TortoiseGit
- 下载地址
官方地址:https://tortoisegit.org/
下载地址:https://download.tortoisegit.org/tgit/2.8.0.0/TortoiseGit-2.8.0.0-64bit.msi
双击下载好的msi安装程序,一直默认下一步即可
安装中文语言包:https://download.tortoisegit.org/tgit/2.8.0.0/TortoiseGit-LanguagePack-2.8.0.0-64bit-zh_CN.msi
双击下载好的msi安装程序,点击下一步等待完成安装后,打开程序设置
- 下载地址