本节课程重点介绍了大模型评测技术的发展情况以及具体的评测方法,以及对OpenCompass工具的功能和架构的介绍,工具的使用非常简单,就是评测过程较为耗时。
作业情况:
InternLM2-Chat-7B 模型在 C-Eval 数据集上性能评测:
结果文件生成:
本节课程重点介绍了大模型评测技术的发展情况以及具体的评测方法,以及对OpenCompass工具的功能和架构的介绍,工具的使用非常简单,就是评测过程较为耗时。
作业情况:
InternLM2-Chat-7B 模型在 C-Eval 数据集上性能评测:
结果文件生成: