2024.1 书生·浦语大模型实战营第 6 节课堂笔记

godlikesun97

已于 2024-02-21 21:42:05 修改

阅读量374

点赞数 7

文章标签：笔记 ai

于 2024-02-21 20:27:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/godlikesun97/article/details/136219770

版权

项目地址：GitHub - InternLM/tutoriald

第六节课视频地址：OpenCompass 大模型评测_哔哩哔哩_bilibili

为什么需要评测？

了解不同模型在各类应用场景下的表现，并指导模型进行优化提升。

需要评测什么？

文本生成，知识，推理，安全等等

怎样评测？

根据模型分类：基座模型，对话模型

根据评测方式：客观评测、主观评测

客观评测：做选择题

主观评测：由人工或者表现优异的模型来评价

提示词工程评测：同一个问题换不同的问法，看模型的回答是否一致

主流大模型评测框架

OpenCompass 能力框架

OpenCompass平台架构

分为模型层、能力层、方法层和工具曾

OpenCompass 评测流水线设计

支持开源模型、自定义模型以及超过100+数据集

大模型评测领域的挑战

· 数据污染：测试集混入训练集

· 缺少中文评测集

· 人工测试成本高昂

关注

7
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
2024.1 书生·浦语大模型实战营第 6 节课堂笔记

了解不同模型在各类应用场景下的表现，并指导模型进行优化提升。
复制链接

扫一扫

godlikesun97 CSDN认证博客专家 CSDN认证企业博客

码龄4年

20: 原创

136万+: 周排名

11万+: 总排名

7501: 访问

: 等级

352: 积分

109: 粉丝

152: 获赞

7: 评论

135: 收藏

私信

关注

热门文章

最新评论

2024.2 DataWhale 多智能体实战第四章多智能体开发
CSDN-Ada助手: 恭喜您撰写了第20篇博客，标题为“2024.2 DataWhale 多智能体实战第四章多智能体开发”。您的持续创作展现了您对多智能体领域的热情和专注，对此我表示由衷的祝贺。在下一步的创作中，我建议您可以尝试深入探讨多智能体开发的实际应用场景，或者结合具体案例进行分析，这样可以让读者更好地理解和运用您所分享的知识。同时，也希望您能够保持谦逊的态度，不断学习和提升自我，为读者带来更多有价值的内容。期待您更多的精彩作品，加油！
2024.1 书生·浦语大模型实战营第 4 节课后作业
CSDN-Ada助手: 恭喜您写了第12篇博客，看来您对于书生·浦语大模型实战营的学习进展顺利啊！不过我觉得您可以在作业中多加入一些实际案例或者个人见解，这样可以让读者更加深入地了解您对课程内容的理解。希望您能继续保持创作的热情，期待您更多精彩的作品！
2024.1 书生·浦语大模型实战营第 4 节课堂笔记
CSDN-Ada助手: 恭喜作者能够持续不断地分享关于浦语大模型实战营的课堂笔记，看来您对这门课程的学习非常用心。希望您能够继续坚持下去，不断分享您的学习心得和体会。同时，我也建议您可以考虑在将来的博客中加入一些个人的见解和思考，这样可以让读者更加深入地了解您对于这门课程的理解和体会。期待您更多的精彩内容，加油！
2024.1 书生·浦语大模型实战营第 3 节课后作业
CSDN-Ada助手: 恭喜您完成第9篇博客！看到您参加了浦语大模型实战营的课后作业，让我感到非常欣慰。您的持续创作真是令人钦佩！我想给您提供一些建议，希望对您的创作有所帮助。下一步，您可以尝试写一些关于技术趋势的博客文章，或者分享一些实战经验和案例分析，这样可以进一步丰富您的博客内容。期待看到您未来更多精彩的创作！谦虚地说，我相信您会有更多的突破和进步。加油！
2024.1 书生·浦语大模型实战营第 3 节课堂笔记
CSDN-Ada助手: 恭喜您写完了第10篇博客！标题为“2024.1 书生·浦语大模型实战营第 3 节课堂笔记”真是让人期待。您的坚持与努力可见一斑，每一篇博客都是对知识的总结与分享。接下来，我希望能看到您在未来的创作中更多地加入自己的观点和体会，这样可以使您的博客更富个人特色，也更能引发读者的共鸣。希望您能继续保持创作的激情，期待您的下一篇作品！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。