Git-移除对象

最新推荐文章于 2024-08-15 09:00:00 发布

Git开源社区

最新推荐文章于 2024-08-15 09:00:00 发布

阅读量554

点赞数 1

本文链接：https://blog.csdn.net/sinat_30971495/article/details/108399696

版权

当Git项目中意外添加了大文件并随后删除时，该文件仍会占用大量存储空间，影响仓库大小。通过识别大文件、重写提交历史、删除引用并执行repack操作，可以从历史记录中彻底移除大文件，减少仓库大小。警告，此过程会改变提交历史，可能导致与他人协作的冲突。

摘要由CSDN通过智能技术生成

Git 有许多过人之处，不过有一个功能有时却会带来问题：git clone 会将包含每一个文件的所有历史版本的整个项目下载下来。如果项目包含的仅仅是源代码的话这并没有什么坏处，毕竟 Git 可以非常高效地压缩此类数据。不过如果有人在某个时刻往项目中添加了一个非常大的文件，那们即便他在后来的提交中将此文件删掉了，所有的签出都会下载这个大文件。因为历史记录中引用了这个文件，它会一直存在着。

当你将 Subversion 或 Perforce 仓库转换导入至 Git 时这会成为一个很严重的问题。在此类系统中，(签出时) 不会下载整个仓库历史，所以这种情形不大会有不良后果。如果你从其他系统导入了一个仓库，或是发觉一个仓库的尺寸远超出预计，可以用下面的方法找到并移除大 (尺寸) 对象。

警告：此方法会破坏提交历史。为了移除对一个大文件的引用，从最早包含该引用的 tree 对象开始之后的所有 commit 对象都会被重写。如果在刚导入一个仓库并在其他人在此基础上开始工作之前这么做，那没有什么问题 ── 否则你不得不通知所有协作者 (贡献者) 去衍合你新修改的 commit 。

为了演示这点，往 test 仓库中加入一个大文件，然后在下次提交时将它删除，接着找到并将这个文件从仓库中永久删除。首先，加一个大文件进去：

$ curl http://kernel.org/pub/software/scm/git/git-1.6.3.1.tar.bz2 > git.tbz2
    $ git add git.tbz2
    $ git commit -am 'added git tarball'
    [master 6df7640] added git tarball
    1 files changed, 0 insertions(+), 0 deletions(-)
    create