GIT库中禁止追踪文件变化的两种方式


在使用GIT库管理代码的时候,如果工程的编译配置不太合理,编译过程中生成的中间文件会和源代码混杂在一起,或者每次编译都会对某些文件都进行部分更新等。此类文件,往往会对GIT的add和commit操作造成麻烦,特别是当工程中大量存在此类文件时,在进行git add操作时,必需对需要更新的文件一个个单独add,这时真是费事费力,异常痛苦。当然,我们希望遇到每个工程都配置合理,避免上述问题。但是实际工作中,由于历史原因,或者是由于第三方代码的引入,上述问题似乎不可避免。
为了解决上述问题,GIT至少提供了两种方式来禁止追踪以上两类易变化但又不需要频繁check-in的文件,一种是大家熟悉的.gitignore文件,另一种是'git update-index'命令。下面详细描述两种方式的用法。

使用.gitignore文件

使用.gitignore的文件禁止GIT库追踪文件的方法比较简单,用起来很方便,网上的相关介绍也比较多。
比如说工程中有一个加入了一个第三方的源代码包,编译后生成的中间文件.o, .so, .a 文件均不需要添加到GIT库中进行管理,这时,只需要在第三方源代码包的顶级目录下加入一个.gitignore文件,填入如下过滤规则,即可忽略该目录下所有的.o, .so, .a文件:

*.o
*.a
*.so

如果是一个比较大的工程,难以在短时间内确定工程中所有中间生成文件的具体位置,那么也有快速解决问题的办法。我采用的方式如下:

  • Step 1: 取一个干净的初始GIT库;
  • Step 2: 编译整个工程;
  • Step 3: 在GIT库的根目录下,利用git clean -df命令查找出所有未被追踪的中间生成文件

    git clean -df > untracked_file.log

    此时得到的untracked_file.log中包含了编译过程中生成目录和文件,并且还都没有被check-in进GIT库中。untracked_file.log的内容大概如下:

    ......
    Removing project/develop/extra/target/lib/htb.so
    Removing project/develop/mm_test/bin.macan/
    ......
  • Step 4: 利用untracked_file.log 生成.gitignore(大家应该都能猜到该怎么做了)
    编辑untracked_file.log, 查找所有的"Removing "字符串,替换为空,然后把文件改名为.gitignore即可。

    project/develop/extra/target/lib/htb.so
    project/develop/mm_test/bin.macan/
  • step 5: 把生成的.gitignore放在GIT库的根目录下,并上传至GIT库。
    如上操作便可以禁止GIT追踪编译过程中的中间生成目录和文件。

利用'git update-index --assume-unchanged' 命令

当一个文件必需放进GIT库里,同时又不需要每次改动的时候都要在库中做更新的时候,.gitignore就派不上用场了。你可能疑惑,怎么会有这样的文件呢?
举个例子,比如说我的工程中有一个buildtime.h, 每次make的时候,makefile中会自动的调用脚本获取当前系统时间,并更新buildtime.h中关于BUILD_TIME的宏定义。这个文件必需放在库里,否则编译的时候会告诉你找不到头文件;同时,这个文件每次编译都会更新,但是根本不需要提交更新.(历史遗留代码)。
再举个例子,比如说,工程里包含了很多第三方的包,开发时从来不需要改动第三方的源代码,但是每次编译,第三方的源文件或多或少都会发生一些变化。这种情况其实比较常见,原因也比较多,但总之,第三方代码在编译的过程中发生的改动完全不需要被提交到库里。
以上两种情形,.gitignore是没法用的,却可以通过如下命令告诉本地GIT库,不必对指定的文件进行追踪:

git update-index --assume-unchanged project/buildtime.h

如果接手一个比较大的工程,里边有巨多此类的文件,该怎么处理,一个个都找出来吗?不用担心,我采用的方法如下:

  • step 1: 取一个干净的初始GIT库;
  • step 2: 编译整个工程;
  • step 3: 在GIT库的根目录下,利用git clean -df命令,清理掉所有的中间生成文件和目录(参考.gitignore技巧中的step 3);
  • step 4: 利用git status命令,获取modified文件列表;

    git status > modified_file.log

    modified_file.log的内容,通常如下:

    ......
    #        modified:    project/buildtime.h
    ......
  • step 5: 编辑modified_file.log,生成disable_track.sh脚本。同样是对文件是查找,替换操作,最后生成如下的.sh脚本

    #!/bin/bash
    git update-index --assume-unchanged project/buildtime.h
    ......

    通常,我还会再生成一个enable_track.sh脚本,作为disable_track.sh的反向操作,以备不时之需:

    #!/bin/bash
    git update-index --no-assume-unchanged project/buildtime.h
    ......
  • step 6: 在本地库中执行disable_track.sh脚本, 即可禁止本地库对指定的文件进行追踪。如果需要忽略文件巨多,这步操作耗时会比较久,好在只要执行一次就可以了。
  • step 7: 把刚生成的脚本上传到GIT库,通知团队其它成员执行。'git update-index‘ 可不比.gitignore, 这个命令仅对本地库生效,所以需要上传到GIT库,让团队其它开发人员自己在本地库下执行脚本。

总结

我现在使用的GIT工程,每次编译后,大量存在上述两类文件。每次执行git add需要找到自己改动过的文件一个一个添加,实在是无法忍受,就花了点时间在工程里做了上述的处理,效果出奇的好,不但git add可以随便用了,而且,由于大量变化的文件不需要跟踪了,GIT add, commit的操作速度也提升了不少。

  • 4
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
在 Linux 系统上,如果你克隆的 Git包含文件,可能会出现编码问题。为了解决这个问题,你可以尝试以下几种方法: 1. 设置 Git文件名编码 可以通过设置 Git文件名编码来解决文件名乱码的问题。在终端输入以下命令: ``` git config --global core.quotepath false ``` 这个命令会告诉 Git 在显示文件名时不要对其进行转义,从而避免文件名乱码的问题。 2. 设置 Linux 系统的语言环境 在 Linux 系统,语言环境的设置可能会影响文件编码。你可以尝试在终端输入以下命令: ``` export LANG="zh_CN.UTF-8" ``` 这个命令会将语言环境设置为文 UTF-8 编码,从而解决文件名乱码的问题。 3. 使用 Git LFS 如果你的 Git包含大型二进制文件,可以考虑使用 Git LFS 来管理这些文件Git LFS 可以将这些文件存储在单独的服务器上,从而避免文件名乱码的问题。 综上所述,你可以尝试以上方法来解决文件名乱码的问题。如果问题仍然存在,你可以尝试在 Git 克隆命令指定文件编码,例如: ``` git clone --config core.autocrlf=input --config core.safecrlf=false --config core.quotepath=false --config core.filemode=false -c core.eol=lf -c i18n.commitencoding=utf8 -c i18n.logoutputencoding=utf8 -c i18n.commitencoding=utf8 -c i18n.logoutputencoding=utf8 <git-repo-url> ``` 在这个命令,我们指定了 Git文件编码、换行符、字符集编码等参数,从而尽可能地避免文件名乱码的问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值