OpenCompass大模型评测笔记和作业

本文详细阐述了大模型评测的重要性,涉及评测内容、方法(客观和主观评测)、OpenCompass评测平台的使用,以及国内外大模型评测的现状、挑战和实战作业示例。作者分享了使用OpenCompass进行评测的实际操作和注意事项。

书生·浦语大模型实战营笔记系列

6)OpenCompass大模型评测笔记和作业



前言

包括为什么、是什么、怎么做大模型评测以及大模型评测的一些国内外现状及opencompass


一、为什么需要大模型评测

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

二、评测什么

对于传统的NLP任务
在这里插入图片描述
对于大语言模型
在这里插入图片描述

三、如何评测

对于不同的模型评测构建不一样

比如对于基座模型和经过指令微调的对话模型
在这里插入图片描述

客观评测

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值