作为一名实验科研工作者,之前参与过几次和大模型相关的工作,主要负责前端科研相关语料的收集,后期模型的微调都是由合作者完成,不明所以。这次有幸参加Datawhale AI夏令营,想通过一些实操跑通整个流程,只求对大模型有个具象化的了解。
Step1 顺利完成了,在autoDL上创建了实例。
Step2 尝试了多次,都卡在第6步 “dj-process --config solution/image_captioning.yaml
”,总是报错command not found:
(base) root@autodl-container-b67c4ca0a3-7ecc24dd:~# conda activate dj
(dj) root@autodl-container-b67c4ca0a3-7ecc24dd:~# cd autodl-tmp/better_synth_baseline_autoDL
(dj) root@autodl-container-b67c4ca0a3-7ecc24dd:~/autodl-tmp/better_synth_baseline_autoDL# dj-process --config solution/image_captioning.yaml
bash: dj-process: command not found
尝试按照流程重新跑了几遍,每次都会花很长时间在下载模型和数据上,但结果还是一样,command not found。
最后发现,错误是出在完全无脑按照教程一步一步进行:由于粘贴的是社区镜像,所以本身就配置好环境了,我用conda建立了新的环境,覆盖了配置好的。后续又按照社区镜像的教程,直接运行了dj-process,因此command not found。
重新跑上了,现在进展顺利,希望尽快拿到第一个大模型数据合成的跑分。