![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
报错解决记录
幸运的悦子
这个作者很懒,什么都没留下…
展开
-
unrecognized arguments: --local-rank=1报错解决
这里我在train.py脚本文件中果然没有找到–local-rank参数,在很多的parser.add_argument后添加一行parser.add_argument(“–local-rank”, type=int),注意在最后添加而不是刚开始,如果刚开始添加会导致传入参数不匹配而报错。含义:表明在运行 train.py 脚本时,传递了一个未被识别的参数 --local-rank=1。原创 2023-05-09 01:45:00 · 4611 阅读 · 0 评论 -
unhandled cuda error, NCCL version 2.10.3报错解决
这个警告并不会导致代码运行中止,但是给了我启发,我觉得可能就是torch版本与cuda版本不匹配,自然与NCCL也不匹配,于是我删除了torch,使用pytorch官网提供的与本电脑匹配的安装命令行来安装,安装后果然问题解决。在运行这个模型时,我是直接使用require.txt来配置环境的,但是使用这个配置环境是比较死板的,并没有考虑到每个人的电脑本身的各项参数配置。分析:NCCL:一般来是是在配置cuda时就已经配置好了对应版本的NCCL了。之后根据pytorch官网给的命令安装pytorch即可。原创 2023-05-08 21:21:13 · 2537 阅读 · 1 评论