1 基本任务
基础任务(完成此任务即完成闯关)
- 使用 OpenCompass 评测 internlm2-chat-1.8b 模型在 ceval 数据集上的性能,记录复现过程并截图。
2 主要实现
完成环境配置后,解压评测数据集,列出所有跟 InternLM 及 C-Eval 相关的配置使用opencompass进行评测 得到如下结果
基础任务(完成此任务即完成闯关)
完成环境配置后,解压评测数据集,列出所有跟 InternLM 及 C-Eval 相关的配置使用opencompass进行评测 得到如下结果