github仓库中删除历史大文件
有时候误提交了大文件到git仓库,导致代码的拉取特别慢。但是直接删除文件,仓库的大小并没有减小,这是因为大文件已经记录到git历史中了,需要做些额外的操作来真正的删除这些大文件。
-
显示前5个最大文件的id
$ git verify-pack -v .git/objects/pack/pack-*.idx | sort -k 3 -g | tail -5
-
根据id查找文件位置
$ git rev-list --objects --all | grep $文件id
-
从git历史中删除文件
$ git filter-branch --force --index-filter 'git rm -rf --cached --ignore-unmatch $文件名字' --prune-empty --tag-name-filter cat -- --all
-
正式删除文件
$ rm -rf .git/refs/original/ $ git reflog expire --expire=now --all $ git gc --prune=now $ git gc --aggressive --prune=now # 如果这一步有权限不足的问题,需要手动到github上将master分支的保护去掉 $ git push origin master --force # 清理远程仓库 $ git remote prune origin