任务: 使用 OpenCompass 评测 internlm2-chat-1.8b 模型在 ceval 数据集上的性能,记录复现过程。 复现过程 1、按照教材安装环境。https://github.com/InternLM/Tutorial/blob/camp3/docs/L1/OpenCompass/readme.md 2、使用命令行配置参数法进行评测,在10%的A100设备上运行,大概用时1.5h 评测完成后,将会看到: