学习目标: OpenCompass 大模型评测 学习内容: 模型评测 学习时间: 20240120 学习产出: 为什么需要评测:普通用户,开发者,管理机构,产业界 如何评测大预言模型:基座模型,对话模型 客观评测,主观评测,提示词工程 主流大模型评测框架,Meta官方推荐 平台架构:工具层,方法层,能力层,模型层 模型支持 评测流水线设计 前言探索:多模态,法律,医疗 大模型评测领域的挑战