Git基础知识
前言
记录git基础知识,包括基础命令及其背后的原理。
一、Git基本概念
- 版本控制系统
版本控制系统(Version Control System):是一种记录一个或若干文件内容变化,以便将来查阅特定版本修订情况的系统。版本控制系统不仅可以应用于软件源代码的文本文件,而且可以对任何类型的文件进行版本控制。
常见的版本控制系统有:cvs、svn、git - 为什么要有版本控制系统?
在开发过程中,经常需要对一个文件进行修改甚至删除,但是我们又希望能够保存这个文件的历史记录,如果通过备份,那么管理起来会非常的复杂。
在多人开发时,如果需要多人合作开发一个页面,那么修改以及合并也会非常的棘手。容易出现冲突。
1、分布式版本控制系统–Git
分布式主要区别于集中式,集中式就是一台服务器多个用户端,所有用户链接到服务器,像一颗树一样;而分布式是多台服务器,去掉集中式的中心化,多台服务器相互链接,像图一样,特点如下。
- 需要一台服务器作为代码仓库
- 每个用户电脑都是一个服务器(代码仓库),并且和代码仓库是镜像的,用户修改和获取代码都是提交到自己的服务器当中。
- 不需要网络就可以进行工作,当连接网络时,用户可以选择将自己的服务器与代码仓库进行同步。
缺点,对大文件提交不友好(大文件的修改提交用git-lfs)+命令多学习成本大。
Git发展过程,bitKeeper(非开源软件)->Git->GitHub(存开源项目) / Gitlab(开源,便于定制化搭建,公司) / Gerrit(Google针对Android开发的,多仓库编译场景)
2、Git配置命令
git config 设置仓库的一些信息,配置信息有三个作用域,
–global,常用,当前用户有效;–local,当前仓库有效;–system,当前系统有效。
- 先配置用户名,git config --global user.name “Bob”;git config --global user.email xx@simple.com
- 查看配置信息,git config list
- 查看帮助文档,git config --help;–help是通用的,即git <command> --help
3、Git原理
三种文件状态,
untracked:文件只在工作区;
modified:工作区和暂存区不一样;
staged:已提交到暂存区;
4、Git常用指令
- 创建本地仓库,git init,–initial-branch 初始化的分支;–bare创建一个裸仓库,只有.git目录,不允许添加工作文件,用于服务端仓库;–template可以通过模板来创建预先构建好的git目标。
- 查看工作区状态,git status
- 添加文件到缓存区,git add <修改的文件>,可以通过"."来代替所有修改文件。
- 提交修改,git commit -m “提交描述”
- 关联远端仓库,git remote add origin url
- 修改远端仓库url,git remote set-url origin url
- 和远端仓库同步,git push -u origin master(选择自己需要同步的分支branch)
- 拉取代码同步本地仓库,git pull / git fetch
- 克隆仓库,git clone url
- git命令别名配置,git config --global alias.cin “commit --amend --no-edit”
- instead of 配置,url替换,git config --global url.url1:.insteadOf url2
- 从fetch/push不同仓库,而不是配置两个origin,git remote add origin url;git remote set-url --add --push origin url
- ssh-keygen -t ed25519 -C “your_email@example.com”,密钥默认存在~/.ssh/id_ed25519.pub
注:目前的Key有4种类型,dsa/rsa/ecdsa/ed25519,默认rsa,但是由于一些安全问题,不推荐dsa/rsa,Windows在ssh层面直接拒绝dsa/rsa命令,存在拉不下代码的情况。
注:
git commit --amend可以修改commit信息,但是会生成新的commitid,就会导致原来的commitid是悬空的,所以可以gc掉,但有reflog日志记录,不能真正删掉,所以git reflog expire --expire=now --all;再git gc --prune=now(默认两周前)来删除刚才产生的悬空objects,而且会对文件进行压缩。
5、git配置文本编辑器
-
设置编辑器
git config --global core.editor “‘D:\工具软件\NotePad\notepad.6.9.2\notepad++.exe’ -multiInst -notabbar - nosession -noPlugin”
注:
后面的参数为notepad对应的支持的命令。
Ø -multiInst 允许多个 Notepad++ 同时运行
Ø -notabbar 隐藏工具栏
Ø -nosession 在 Notepad++ 启动后不加载之前保持的会话
Ø -noPlugin 不加载任何插件 -
设置commit的的全局提交模板,git config --global commit.template “D:\git_template.txt”
二、Git如何进行版本管理
1、objects
每一次commit都会生成一个commitid文件,该文件里面有parentid,这样就形成了版本链条。该文件里面有目录树treeid的文件名,这里就能寻找到当前版本的目录树,而目录树中有每个文件blobid,这样就找到了具体文件。
可以理解为这三个object就能进行版本控制。
2、比较差异
- 查看提交历史,git log;git log --online
- 比较修改,git diff <file>,查看工作区和暂存区file的差别;git diff -cached,比较上一次提交和当前暂存区文件的改动。
- git diff <id1> <id2>,比较两次commit的差异,id是commitid。
- HEAD表示当前版本,HEAD~表示上一个版本,HEAD~~表示上上个版本,HEAD~n表示上n个版本。
3、恢复与回退
git reset
原理:git reset的作用是修改HEAD的位置,即将HEAD指向的位置改为为之前存在的某个版本。
- 将缓存区的文件拉回来,git reset – file
- git reset --soft HEAD~1,使用当前的指令,工作区和暂存区的代码不会受到影响,但是本地仓库的代码会回滚到YY对应的commitid上。
- git reset --mixed HEAD~1,使用当前的命令,工作区代码不会受到影响,但是暂存区、本地仓库区的代码已经回滚到了YY对应的commit-id上。
- git reset --hard HEAD~1,使用当前的命令,工作区、暂存区、本地仓库都会回滚到对应commit-id上,
4、Revert反做
git revert是用于“反做`某一个版本,以达到撤销该版本的修改的目的。比如,我们commit了三个版本(版本一、版本二、版本三),突然发现版本二不行(如:bug),想要撤销版本二,但又不想影响撒销版本三的提交,就可以用gitrevert命令来反做版本二,生成新的版本四,这个版本四里会保留版本三的东西,但撤销了版本二的东西。
git revert -n commitid
5、分支
- master分支
主分支,创建项目时即创建的分支,用于部署生产环境的分支,是所有分支的主干,与当前线上代码保持统一。
由主开发人员、研发组leader管控、不允许其他开发在该分支上直接开发。 - tag标签
每次从master发布生产环境后,需要用tag标记一个版本,再master分支上的每个tag都对应历史的一个线上版本。方便后续追溯及复查代码。 - develop分支
1.开发分支,开发者各类开发功能的合并分支,即当前最新功能的分支。
2.开发人员会将自己开发的功能分支提交到dev分支上,由主开发人员来进行审核,通过后合并到dev分支上,一般测试环境就是从develop分支拉取代码。
3.不允许开发者在该分支上直接开发。 - feature分支
1.功能开发分支,需要开发新功能时,每个开发者以develop分支为基础,从dev或master分支拉取代码,并创建新的feature分支。
2.功能开发完成后,就提交到develop分支上,由主开发者审核合并,功能开发完成后需要删除feature分支,下次开发时再冲突拉取创建。 - release分支
1.发布分支,feature分支合并到dev分支后,准备发布新版本时,再创建一个新的release分支,分支名可以以功能名命名,比如release-user,允许存在多个release分支。
2.预生产环境从release分支拉取代码发布,如果出现bug就从release分支拉取bugfix分支进行修复,测试成功后,release分支合并到dev分支和master分支,并且删除release分支。 - bugfix分支
1.bug修复分支,也叫hotfix分支,正式发布之后会出现bug,这时需要开发者从master或者release分支拉取并创建一个bugfix分支,分支名可根据开发者名称来命名。
2.修复完成之后,合并到master或release分支上,并且删除bugfix分支。
a.分支操作
- 查看分支,git branch
- 新建分支,git branch <分支名>
- 创建并切换分支,git branch -b <分支名>
- 切换分支,git checkout <分支名>
- 合并分支(若有冲突,需要解决再合并),git checkout <目标分支>,git merge <被合并的分支>
- 删除分支,git branch -d <分支名>
b.rebase 变基分支操作原理
把指定分支的信息,合并到当前分支上。
git rebase 分支名
遇到冲突,解决后继续执行
git rebase --continue
终止rebase行动
git rebase --abort
c.rebase和merge的区别
merge合并的特点:
- 合并后会自动生成一次commit提交记录
- 引入一次合并的历史记录,合并后的所有 commit 会按照提交时间从旧到新排列。
rebase合并的特点: - 会合并之前的commit历史,并不一定按照时间线排列。
- 会生成一条分支线,看着比较简洁。
三、Git同步远程仓库
- 查看远程代码库,git remote -v
- 添加删除远程代码库,git remote add/remove
- 本地分支—>远程分支,git push
- 远程分支—>本地分支(不自动合并),git fetch
- 远程分支---->本地分支(自动合并,可能冲突),git pull [git fetch + git merge]
- 克隆远程仓库,git clone + 路径
- 向服务器询问远程仓库信息,git remote show origin
四、Git工作流
定义不同特性的开发分支,上线分支,在开发分支完成开发后再通过MR/PR合入主分支。可以自定义/Fast-Forward/Three-Way Merge.
1、分支管理流
分支管理流 | 特点 |
---|---|
Git Flow | 分支类型丰富,规范严格 |
Github Flow | 只有主干分支和开发分支,规则简单 |
Gitlab Flow | 在主干分支和开发分支之上构建环境分支,版本分支,满足不同发布或者环境的需要 |
- Git Flow
Master,主干分支,可以打一些tag来标记特别的版本。
Develop,开发分支,从master上拉下来的开发。
Feature,特性分支,从Develop上拉下来进行特性开发。
Release,发布分支,专门的发布分支线,develop分支合并到release分支。
Hotfix,热修复分支,从develop或者master上拉分支下来进行bug修复。
优点,代码清晰,很难混乱。
缺点,流程复杂,上线节奏慢,一旦没完全按规范实行,代码版本就会很乱。 - GitHub Flow
只有一个主干分支和开发分支,先fork进行开发,基于pull request往主干提交代码,PR,一般开源项目就是这样;或者是团队内,给队友分配权限,直接在同一个仓库内进行开发。
2、分支保护
setting中配置Branches的Rules,可以设置pr才能merge;不参数merge节点;admin也需要遵守规则;解决掉评论的问题才能提交;等等。
3、分支合并
写完代码,都需要进行merge,两种方式,FastForwar / three-way,如果想保存线性合并,需要用到上面讲的rebase.
git merge branch1 --ff–only,fastforwrd,不会参数生新commitid节点。
git merge branch1 --no-ff,threeway,会参生新commitid节点。
五、.gitignore
在一些项目中,我们不想让本地仓库的所有文件都上传到远程仓库中,而是有选择的上传。例如,一些生成的可执行
xx.exe文件,测试文件等。为了达到这样的目标,git引入了.gitignore文件,使用该文件可以选择性的上传文件。
- 常用规则
(1) 注释文件, 以#开头的文件在.gitignore中不起任何作用
#content
(2) 以‘/’仅屏蔽当前文件夹ToDo下的文件。需要注意的是空文件夹不会被追踪。
/ToDo
(3)以’/'结尾的表示屏蔽所有名为ToDo文件夹下的文件下的文件都会被屏蔽。
ToDo/
(4) 屏蔽所有扩展名未a的文件,例如 1.a,3.a文件
*.a - 原则
- .gitignore”文件作用是可以忽略原来制定的规则,也可以根据自己的需要制定自己的规则。使用git过程中,总会有些文件无需纳入git的管理,也不希望它们出现在未跟踪文件列表,这时可以使用“.gitignore”文件自动忽略这些文件。
- 忽略操作系统自动生成的文件,比如缩略图等;
- 忽略编译生成的中间文件、可执行文件等,也就是如果一个文件是通过另一个文件自动生成的,那自动生成的文件
就没必要放进版本库,比如vs生成的xx.obj文件; - 忽略编译生成的中间文件、可执行文件等,也就是如果一个文件是通过另一个文件自动生成的,那自动生成的文件就没必要放进版本库,比如Java编译产生的.class文件;
- 示例
六、SSH公钥验证
git默认使用https协议,每次pull,push的时候其实存在一定的安全漏洞。本质每次pull和push还需要输入密码(没有提示输入是因为 windows 保存了你的账号密码作为凭证)。使用git的ssh协议,安全性更高,并且可以省去每次输入密码的步骤。
除此之外,https的httpspostbuff限制1M,大文件上传会出现问题。
- 操作流程
- 配置自己的邮箱和用户名
git config user.name xxx
git config user.email xxx - ssh-keygen -t rsa -C “这里换上你的邮箱” 说明:命令执行完后,会在指定的保存路径下会生成2个文件,id_rsa私钥文件和id_rsa.pub公钥文件。一般是在
当前登录用户路径下,可以使用 ls ~/.ssh来查看 - 配置密码
登录上对应的git,点击SSH and GPG keys -》New SSH key,把id_rsa.pub中的文件拷贝进去即
注:
ssh免密配置-公私密钥机制
url:git@github.com:git/git.git
目前的Key有4种类型,dsa/rsa/ecdsa/ed25519,默认rsa,但是由于一些安全问题,不推荐dsa/rsa,Windows在ssh层面直接拒绝dsa/rsa命令,存在拉不下代码的情况。
ssh-keygen -t ed25519 -C “your_email@example.com”,密钥默认存在~/.ssh/id_ed25519.pub
七、图形化界面推荐
- MAC
- Windows
总结
1)git基本命令和原理,管理版本的三个重要objects(blob/tree/commit),当然还有一个tag。
2)git为分布式版本管理系统,所以第一步把文件提交给本地仓库,第二步同步给远端仓库。
3)git有很多分支,每个分支都有自己的4个objects,不同分支可进行合并。
4)ssh比https更安全,且上传大文件没有问题。