什么是版本控制
Git是目前世界上最先进的分布式版本控制系统(没有之一)。
那了解Git之前,我们就要知道什么是版本控制。
版本控制(Revision control)是一种在开发的过程中用于管理我们对文件、目录或工程等内容的修改历史,方便查看更改历史记录,备份以便恢复以前的版本的软件工程技术。
-
实现跨区域多人协同开发
-
追踪和记载一个或者多个文件的历史记录
-
组织和保护你的源代码和文档
-
统计工作量
-
并行开发、提高开发效率
-
跟踪记录整个软件的开发过程
-
减轻开发人员的负担,节省时间,同时降低人为错误
简单说就是用于管理多人协同开发项目的技术。
没有进行版本控制或者版本控制本身缺乏正确的流程管理,在软件开发过程中将会引入很多问题,如软件代码的一致性、软件内容的冗余、软件过程的事物性、软件开发过程中的并发性、软件源代码的安全性,以及软件的整合等问题。
常见的版本控制工具
主流的版本控制器有如下这些:
-
Git
-
SVN(Subversion)
-
CVS(Concurrent Versions System)
-
VSS(Micorosoft Visual SourceSafe)
-
TFS(Team Foundation Server)
-
Visual Studio Online
版本控制产品非常的多(Perforce、Rational ClearCase、RCS(GNU Revision Control System)、Serena Dimention、SVK、BitKeeper、Monotone、Bazaar、Mercurial、SourceGear Vault),现在影响力最大且使用最广泛的是Git与SVN
Git 与 SVN 区别
Git和SVN最大的区别就是SVN都是集中式的版本控制系统,而Git是分布式版本控制系统
集中式版本控制系统
版本库是集中存放在中央服务器的,而干活的时候,用的都是自己的电脑,所以要先从中央服务器取得最新的版本,然后开始干活,干完活了,再把自己的活推送给中央服务器。
集中式版本控制系统最大的毛病就是必须联网才能工作,如果在局域网内还好,带宽够大,速度够快,可如果在互联网上,遇到网速慢的话,速度就会很慢。
而且所有数据都保存在单一的服务器上,有很大的风险这个服务器会损坏,这样就会丢失所有的数据,必须要定期备份数据。
分布式版本控制系统
分布式版本控制系统中,每个人的电脑上都是一个完整的版本库,这样,你工作的时候,就不需要联网了,因为版本库就在你自己的电脑上。既然每个人电脑上都有一个完整的版本库,那多个人如何协作呢?比方说你在自己电脑上改了文件A,你的同事也在他的电脑上改了文件A,这时,你们俩之间只需把各自的修改推送给对方,就可以互相看到对方的修改了。
和集中式版本控制系统相比,分布式版本控制系统的安全性要高很多,因为每个人电脑里都有完整的版本库,某一个人的电脑坏掉了不要紧,随便从其他人那里复制一个就可以了。而集中式版本控制系统的中央服务器要是出了问题,所有人都没法干活了。
在实际使用分布式版本控制系统的时候,其实很少在两人之间的电脑上推送版本库的修改,因为可能你们俩不在一个局域网内,两台电脑互相访问不了,也可能今天你的同事病了,他的电脑压根没有开机。因此,分布式版本控制系统通常也有一台充当“中央服务器”的电脑,但这个服务器的作用仅仅是用来方便“交换”大家的修改,没有它大家也一样工作,只是交换修改不方便而已。
当然,Git的优势不单是不必联网这么简单,后面我们还会看到Git极其强大的分支管理,把SVN等远远抛在了后面。
Git安装与配置
打开 git官网,下载git对应操作系统的版本。
所有东西下载慢的话就可以去找镜像!
官网下载太慢,我们可以使用淘宝镜像下载:http://npm.taobao.org/mirrors/git-for-windows/
下载对应的版本然后按默认选项安装即可!
安装成功后在开始菜单中会有Git项,菜单下有3个程序:任意文件夹下右键也可以看到对应的程序!
-
Git Bash:Unix与Linux风格的命令行,使用最多,推荐最多
-
Git CMD:Windows风格的命令行
-
Git GUI:图形界面的Git,不建议使用,尽量熟悉常用命令
安装成功后,也可以在任意文件夹下右键也可以看到对应的程序!
因为Git是分布式版本控制系统,所以,每个机器都必须自报家门,安装完成后,必须要设置用户名和邮箱,在命令行输入:
git config --global user.name "Your Name"
git config --global user.email "email@example.com"
查看配置
git config -l
查看不同级别的配置文件:
#查看系统config
git config --system --list
#查看当前用户(global)配置
git config --global --list
Git 工作区、暂存区和版本库
我们先来理解下 Git 工作区、暂存区和版本库概念:
- 工作区(Working Directory):就是你在电脑里能看到的目录(git目录)。
- 暂存区(Stage/Index):英文叫 stage 或 index。一般存放在 .git 目录下的 index 文件(.git/index)中,所以我们把暂存区有时也叫作索引(index)。
- 版本库(Repository或Git Directory):工作区有一个隐藏目录 .git,这个不算工作区,而是 Git 的版本库。
如果在加上远程的git仓库(Remote Directory)就可以分为四个工作区域。
-
图中左侧为工作区,右侧为版本库。在版本库中标记为 “index” 的区域是暂存区(stage/index),标记为 “master” 的是 master 分支所代表的目录树(master是Git为我们自动创建的第一个分支)。
-
图中我们可以看出此时 “HEAD” 实际是指向 master 分支的一个"游标"。所以图示的命令中出现 HEAD 的地方可以用 master 来替换。
-
图中的 objects 标识的区域为 Git 的对象库,实际位于 “.git/objects” 目录下,里面包含了创建的各种对象及内容。
-
当对工作区修改(或新增)的文件执行 git add 命令时,暂存区的目录树被更新,同时工作区修改(或新增)的文件内容被写入到对象库中的一个新的对象中,而该对象的ID被记录在暂存区的文件索引中。
-
当执行提交操作(git commit)时,暂存区的目录树写到版本库(对象库)中,master 分支会做相应的更新。即 master 指向的目录树就是提交时暂存区的目录树。
-
当执行 git reset HEAD 命令时,暂存区的目录树会被重写,被 master 分支指向的目录树所替换,但是工作区不受影响。
-
当执行 git rm --cached 命令时,会直接从暂存区删除文件,工作区则不做出改变。
-
当执行 git checkout . 或者 git checkout – 命令时,会用暂存区全部或指定的文件替换工作区的文件。这个操作很危险,会清除工作区中未添加到暂存区的改动。
-
当执行 git checkout HEAD . 或者 git checkout HEAD 命令时,会用 HEAD 指向的分支中的全部或者部分文件替换暂存区和以及工作区中的文件。这个命令也是极具危险性的,因为不但会清除工作区中未提交的改动,也会清除暂存区中未提交的改动。
Git工作流程和文件
工作流程
git的工作流程一般是这样的:
- 克隆 Git 资源作为工作目录。
- 在克隆的资源上添加或修改文件。
- 将需要进行版本管理的文件放入暂存区域;
- 确认修改完成后,将暂存区文件提交仓库。
- 在修改完成后,如果发现错误,可以撤回提交并再次修改并提交。
因此,git管理的文件有四种状态:为跟踪(Untracked),已修改(modified),已暂存(staged),已提交(CCommitted)
版本控制就是对文件的版本控制,要对文件进行修改、提交等操作,首先要知道文件当前在什么状态,不然可能会提交了现在还不想提交的文件,或者要提交的文件没提交上。
-
Untracked: 未跟踪, 此文件在文件夹中, 但并没有加入到git库, 不参与版本控制. 通过git add 状态变为Staged.
-
Committed: 文件已经入库, 未修改, 即版本库中的文件快照内容与文件夹中完全一致. 这种类型的文件有两种去处, 如果它被修改, 而变为Modified. 如果使用git rm移出版本库, 则成为Untracked文件
-
Modified: 文件已修改, 仅仅是修改, 并没有进行其他的操作. 这个文件也有两个去处, 通过git add可进入暂存staged状态, 使用git checkout 则丢弃修改过, 返回到Committed状态, 这个git checkout即从库中取出文件, 覆盖当前修改 !
-
Staged: 暂存状态. 执行git commit则将修改同步到库中, 这时库中的文件和本地文件又变为一致, 文件为committed状态. 执行git reset HEAD filename取消暂存, 文件状态为Modified
查看文件状态
上面说文件有4种状态,通过如下命令可以查看到文件的状态:
#查看指定文件状态
git status [filename]
#查看所有文件状态
git status
忽略文件
有些时候我们不想把某些文件纳入版本控制中,比如数据库文件,临时文件,设计文件等
在主目录下建立".gitignore"文件,此文件有如下规则:
-
忽略文件中的空行或以井号(#)开始的行将会被忽略。
-
可以使用Linux通配符。例如:星号(*)代表任意多个字符,问号(?)代表一个字符,方括号([abc])代表可选字符范围,大括号({string1,string2,…})代表可选的字符串等。
-
如果名称的最前面有一个感叹号(!),表示例外规则,将不被忽略。
-
如果名称的最前面是一个路径分隔符(/),表示要忽略的文件在此目录下,而子目录中的文件不忽略。
-
如果名称的最后面是一个路径分隔符(/),表示要忽略的是此目录下该名称的子目录,而非文件(默认文件或目录都忽略)。
#为注释
##----------idea----------
*.iml
.idea/
*.ipr
*.iws
*.pfx
/target/
Git 创建仓库
本地仓库搭建
使用当前目录作为Git仓库,我们只需使它初始化。
git init
使用我们指定目录作为Git仓库。也可以在命令后加上目录名称
git init reponame
在执行完成 git init 命令后,Git 仓库会生成一个 .git 目录,该目录包含了资源的所有元数据,其他的项目目录保持不变。
注:.git是隐藏文件夹,需要显示隐藏文件才可以看到
初始化后,Git就可以对该目录下的文件进行管理
克隆远程仓库
另一种方式是克隆远程目录,是将远程服务器上的仓库完全镜像一份至本地!(类似 svn checkout)。
克隆仓库的命令格式为:
git clone <repo> <directory>
参数说明:
- repo:Git 仓库。
- directory:本地目录。
Git常用命令
分支管理
创建分支命令:
# 创建分支,依然停留在当前分支
git branch (branchname)
# 新建一个分支,并切换到该分支
git checkout -b [branch]
切换分支命令:
#切换分支,撤销修改命令也是checkout容易混淆
git checkout (branchname)
# 同checkout命令,switch更明确更好理解
git switch (branchname)
# 创建并切换到新的分支
git switch -c (branchname)
查看分支
# 列出所有本地分支
git branch
# 列出所有远程分支
git branch -r
表示我们有一个叫做 master 的分支和一个叫dev的分支,并且当前处于dev分支。
删除分支
git branch -d (branchname)
合并分支
分支有了独立内容,你终究会希望将它合并回到你的主分支。 你可以使用以下命令将任何分支合并到当前分支中去:
git merge <branchname>
合并冲突
合并并不仅仅是简单的文件添加、移除的操作,Git 也会合并修改。如果两个分支同时修改了一个文件,合并时就会合并冲突
Git用<<<<<<<
,=======
,>>>>>>>
标记出不同分支修改的内容
这时候我们就要判断,保留哪个分支修改的内容,修改后再进行合并