查看torch和cuda安装的版本
print(torch.__version__)
print(torch.version.cuda)
查看cuda是否可用
print(torch.cuda.is_available())
查看GPU占用情况
nvidia-smi
gpustat -i 1
程序卡死了:
#用 nvidia-smi 去看那张卡的程序的 pid
nvidia-smi
#复制pid然后kill掉
kill -9 [pid]
【2022.4.24】昨天的时候不小心add了好些大文件在一个文件夹里,然后删除了还是一直push不上去,今天整了一天终于push上去了,主要是需要从历史commit记录里把这些文件删除掉。参考:https://www.zhihu.com/question/29769130
#1. 运行 gc ,生成 pack 文件(后面的 --prune=now 表示对之前的所有提交做修剪,有的时候仅仅 gc 一下.git 文件就会小很多)
$ git gc --prune=now
#2. 找出最大的三个文件
$ git verify-pack -v .git/objects/pack/*.idx | sort -k 3 -n | tail -3
# 示例输出:
#1debc758cf31a649c2fc5b0c59ea1b7f01416636 blob 4925660 3655422 14351
#c43a8da9476f97e84b52e0b34034f8c2d93b4d90 blob 154188651 152549294 12546842
#2272096493d061489349e0a312df00dcd0ec19a2 blob 155414465 153754005 165096136
#3. 查看那些大文件究竟是谁(c43a8da 是上面大文件的hash码)
$ git rev-list --objects --all | grep c43a8da
# c43a8da9476f97e84b52e0b34034f8c2d93b4d90 data/bigfile
# 4.移除对该文件的引用(也就是 data/bigfile)也可以直接删除整个文件夹
$ git filter-branch --force --index-filter "git rm --cached --ignore-unmatch 'data/bigfile'" --prune-empty --tag-name-filter cat -- --all
#输出(这里我重复了好多次所以试unchanged)
# Rewrite 1221b9a8013f3be143d53d443c6c2b36e015561d (13/26) (1 seconds passed, remaining 1 predicted)
# WARNING: Ref 'refs/heads/master' is unchanged
# WARNING: Ref 'refs/remotes/ChinaAir/master' is unchanged
#5.进行 repack 这里卡了我比较久的一步是‘refs/original’这个,替换成上述output的第一个引号里的内容,也就是'refs/heads/master'
# 其他的两行不用改
$ git for-each-ref --format='delete %(refname)' refs/original | git update-ref --stdin
$ git reflog expire --expire=now --all
$ git gc --prune=now
# 6.查看 pack 的空间使用情况
$ git count-objects -v
# 7. 在push前再commit一下不然push不上去
$ git commit -m 'update'
# 8. 强制push
$ git push --force
指定GPU run code:
CUDA_VISIBLE_DEVICES=0
打印当前时间:
import time
print(time.strftime("%Y-%m-%d-%H_%M_%S", time.localtime()))
路径问题 error: ModuleNotFoundError: No module named ‘src’(参考:https://stackoverflow.com/questions/51049663/python3-6-error-modulenotfounderror-no-module-named-src)
export PYTHONPATH="${PYTHONPATH}:/path/to/your/project/" # 增加一个path
echo ${PYTHONPATH} # 查看path
export PYTHONPATH="/path/to/your/project/" # 指定唯一path
nni运行config.yml文件
nnictl create --config config.yml --port 8088