一.环境准备
在创建开发机界面选择镜像为 Cuda11.7-conda,并选择 GPU 为10% A100。
二.数据准备
解压评测数据集到 data/ 处,将会在 OpenCompass 下看到data文件夹,查看支持的数据集和模型,列出所有跟 InternLM 及 C-Eval 相关的配置,将会看到下图
三启动测评
确保按照上述步骤正确安装 OpenCompass 并准备好数据集后,可以通过以下命令评测 InternLM2-Chat-1.8B 模型在 C-Eval 数据集上的性能。由于 OpenCompass 默认并行启动评估过程,我们可以在第一次运行时以 --debug 模式启动评估,并检查是否存在问题。在 --debug 模式下,任务将按顺序执行,并实时打印输出。
遇到错误: