基础作业:
概览
环境配置
数据准备
解压评测数据集到 data/ 处
将会在opencompass下看到data文件夹
查看支持的数据集和模型
启动评测 (10% A100 8GB 资源)
确保按照上述步骤正确安装 OpenCompass 并准备好数据集后,可以通过以下命令评测 InternLM2-Chat-1.8B 模型在 C-Eval 数据集上的性能。由于 OpenCompass 默认并行启动评估过程,我们可以在第一次运行时以 --debug 模式启动评估,并检查是否存在问题。在 --debug 模式下,任务将按顺序执行,并实时打印输出。
如果一切正常,应该看到屏幕上显示 “Starting inference process”:
评测完成后,将会看到: