最近在colab上训练时,到一定时间,wandb就会导致程序崩溃。
导致wandb崩溃的原因有两个:
- 网络环境问题
wandb有时无法通过国内正常网络访问 - 离线还是崩溃
设置离线模型,但是没有输入秘钥,还是会崩溃。
在训练代码的开头,添加这段代码就可以。import os os.environ["WANDB_API_KEY"] = '+++++++++++' # 将引号内的+替换成自己在wandb上的一串值 os.environ["WANDB_MODE"] = "offline" # 离线 (此行代码不用修改)