Git Large File Storage(Git LFS)是一个 Git 扩展,用于改善大文件的处理。著名的huggingface就是使用它存储大模型文件。在使用传统的 Git 时,所有历史记录中的文件都存储在 Git 仓库中,这可能导致仓库变得异常庞大,尤其是当仓库包含大量的二进制文件(如图片、视频、数据集等)时。Git LFS 通过将大文件的内容存储在远程服务器上,并在 Git 仓库中保留指向这些大文件的指针,来解决这个问题。
主要特点
-
改善大文件的处理:Git LFS 允许您在 Git 仓库中以更高效的方式处理大文件。
-
文件指针替代实际文件:在提交到 Git 仓库时,大文件会被替换为轻量级的指针文件,而文件内容本身存储在 LFS 服务器上。
-
节省空间:这种方法减少了本地仓库的大小,加快了克隆和拉取操作的速度。
-
透明使用:对于使用仓库的用户来说,除了初始设置外,使用 Git LFS 与使用普通 Git 没有太大区别。
使用场景
- 管理大型二进制文件:适合项目中包含大量视频、图片、音频文件和二进制数据集的情况。
- 游戏开发、机器学习项目、视频制作等领域,这些领域通常需要处理大量的大型文件。
如何使用 Git LFS
-
安装 Git LFS:首先,需要在您的系统上安装 G