1. 关于评测的三个问题 2. 为什么需要评测 3. 需要评测什么 4. 如何评测大模型 5. 主流大模型评测框架 6. 大模型评测领域的挑战 7. 动手实践 7.1 环境安装 直接git clone会有网络问题,解决办法: 7.2 数据准备 略 7.3 启动评测 跑了好久,终于跑完