在git库中有时会存在很大的文件,比如二进制文件、记录账号密码的文件或者一些zip文件等。我们可能会忘记在gitignore中加上这些文件名,在commit和pull的时候就会很慢,甚至出错
下面分几步处理这些大文件
1. 显示10个最大的文件id列表
git verify-pack -v .git/objects/pack/pack-*.idx | sort -k 3 -g | tail -10
gcxdeMacBook-Pro-2:futures_monitor_middle_ware Jon$ git verify-pack -v .git/objects/pack/pack-*.idx | sort -k 3 -g | tail -10
edea61b80f6272018b2124ce53ac606d439d0acc blob 961503 251646 29558107
9868c7a5fc0bf00f833262e1012e8cbcd5aa86c7 blob 1146048 82351 157660
fb7d71340351b16d28ce676c91e62f3f97983551 blob 1155588 83093 165177
0076fd6dad7869ca96643dc3ff9cef9aba8eb440 blob 1526595 262606 203188
f21d556fd13404888eb1c125361f73bcf6ae0b12 blob 1556606 695333 1761269 1 3139ff8abfa6eb8918e201dbbdc6c0914dab9bea
3f964ea2f27fb1e870d7a6e9ebc14f1a96b95082 blob 4116886 495587 3689406
ae73dd49d3a18e5cc751ccf7aec73bd5849e3edd blob 7187167 1232804 2456602
3139ff8abfa6eb8918e201dbbdc6c0914dab9bea blob 8647930 1246216 515053
55d4e40c0927d5d489c0c92466a0d656f7068bcd blob 15979790 14159723 130211
d1b54d4c22d412587e36c70c84e12b38708efde9 blob 81326758 25313357 4193696
2. 根据文件id找出文件所在路径
git rev-list --objects --all | grep 55d4e40c0927d5d489c0c92466a0d656f7068bcd
gcxdeMacBook-Pro-2:futures_monitor_middle_ware Jon$ git rev-list --objects --all | grep 55d4e40c0927d5d489c0c92466a0d656f7068bcd
55d4e40c0927d5d489c0c92466a0d656f7068bcd node_modules.zip
3. 删除文件
git log --pretty=oneline --branches -- your_file
git log --pretty=oneline --branches -- node_modules.zip
4. 删除文件的历史记录
git filter-branch --force --index-filter 'git rm -rf --cached --ignore-unmatch 你的大文件名' --prune-empty --tag-name-filter cat -- --all
5. 清除缓存(真正删除)
rm -rf .git/refs/original/
git reflog expire --expire=now --all
git gc --prune=now
git gc --aggressive --prune=now
git push origin master
6. 让远程仓库变小
git remote prune origin