引言
今天发现gitlab上的程序竟然有200多兆,但是下载源码并没有那么大,最后发现是git文件夹下的pack文件过大,所以记录一下
参考:https://blog.csdn.net/haorenlin5945/article/details/89498289
https://www.cnblogs.com/lout/p/6111739.html
以下操作步骤
.git/objects/pack 文件过大,可能是由于开发过程中上传过大文件,虽然现已删除,但仍然保存着git记录中。
解决办法:
一、删除仓库上的项目,重新提交代码。
二、彻底清除历史记录
1.识别出最大的三个文件
执行:
git verify-pack -v .git/objects/pack/pack-*.idx | sort -k 3 -n | tail -3
返回:
5d4ba4bc42c8ab2d6f05e960da473a03dda4b8bc blob 9174224 9155533 11001
93b84be2f3835f922350c0fdf904f7c9d879aa97 blob 9324204 9305573 10401125
8c98a6a9529dc3d1e428e94b67780bf8251d3aad blob 9661570 9642954 1115
da457035bbe6134a707ed982b8231a1d9fb46f5d blob 9685628 9666932 9727913
829b9d04b876f058b56849f7296c270a12f3ce04 blob 9688889 9670122 23856
2.查询大文件的文件名
执行:
git rev-list --objects --all | grep 829b9d04b876f058b56849f7296c270a12f3ce04
返回:
829b9d04b876f058b56849f7296c270a12f3ce04 dist.rar
这里看到文件名是dist.rar
3.将该文件从历史记录的所有 tree 中移除
执行:
git filter-branch --index-filter 'git rm --cached --ignore-unmatch dist.rar'
4.执行如下语句
rm -rf .git/refs/original/
git reflog expire --expire=now --all
git fsck --full --unreachable
git repack -A -d
git gc --aggressive --prune=now
git push --force
总结
(此处有个疑问,按照操作步骤,把多余的dist压缩文件的记录清掉了,但是还是很大,发现还存在唯一一个.pack文件很大,网上说的命令都是查找.idx文件中较大的前几个,此处不清楚,先挖坑吧)
次日更新 :
找到另一篇文章,https://www.jianshu.com/p/fe3023bdc825
按照教程实现了本地git的瘦身,但是不懂为什么远程仓库越来越大,变成了500多兆,最后重新关联了一个远程仓库,只有不到20兆了,由此解决问题
git rev-list --objects --all | grep "$(git verify-pack -v .git/objects/pack/*.idx | sort -k 3 -n | tail -5 | awk '{print$1}')"
git filter-branch --force --index-filter 'git rm -rf --cached --ignore-unmatch 你的大文件名' --prune-empty --tag-name-filter cat -- --all
rm -rf .git/refs/original/
git reflog expire --expire=now --all
git gc --prune=now
git gc --aggressive --prune=now
git push origin master --force
git remote prune origin