书生浦语第七次笔记

最新推荐文章于 2024-07-19 22:26:16 发布

梦醒乐

最新推荐文章于 2024-07-19 22:26:16 发布

阅读量163

点赞数 2

文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/invgh/article/details/138169513

版权

一.能力评测的作用

二.大语言模型评测的挑战

挑战有全面性，评测成本，数据污染，鲁棒性

三.OpenCompass 2.0司南大模型评测体系开源历程

四.评测大模型

a.客观评测与主观评测

b.长文本评测

五.工具-基准-榜单三位一体

a.CompassKit:大模型评测全栈工具链

OpenCompass有数据污染检查，更丰富的模型推理接入，长文本能力评测，中英文双语主观评测。

b.OpenComepass评测流水线

六.能力评测的作用

a.能力维度全面升级

b.自研高质量大模型评测基准

c.多层次数学能力评测基准

d.代码解释器能力评测基准

e.大模型细粒度工具能力评测基准

关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
书生浦语第七次笔记

挑战有全面性，评测成本，数据污染，鲁棒性。
复制链接

扫一扫

梦醒乐 CSDN认证博客专家 CSDN认证企业博客

码龄1年

13: 原创

139万+: 周排名

11万+: 总排名

4233: 访问

: 等级

198: 积分

47: 粉丝

68: 获赞

6: 评论

40: 收藏

私信

关注

热门文章

最新评论

书生浦语大模型第五次课堂笔记
CSDN-Ada助手: 恭喜作者第六篇博客的发表，看到你一直在坚持不懈地创作，真的很让人佩服！对于“书生浦语大模型第五次课堂笔记”的分享，我觉得你总结得非常到位，让我受益匪浅。希望你在接下来的创作中可以继续保持这样的热情和耐心，不断提升自己的写作水平，也欢迎尝试更多不同主题和风格的文章，多元化的内容会更吸引读者的眼球。加油！期待你的下一篇作品。
书生浦语大模型第五节课作业
CSDN-Ada助手: 恭喜您完成了第7篇博客“书生浦语大模型第五节课作业”，持续创作是非常了不起的事情！在您的博客中，我看到了您对学习的热情和勤奋，这是非常值得肯定的。接下来，我建议您可以尝试多加入一些个人观点和见解，让您的博客更具深度和独特性。期待看到您更多精彩的作品，加油！
书生浦语大模型实战营第三次笔记
CSDN-Ada助手: 恭喜用户发布了第四篇博客！看到您参加书生浦语大模型实战营并积极记录学习笔记，真的很让人欣慰。希望您能继续坚持创作，分享更多关于实战营的学习心得和体会。或许在下一篇博客中，可以结合自己的实践经验，分享一些具体的应用案例或者解决问题的方法，这样更能吸引读者的注意。希望您不断进步，继续保持谦虚的态度，共同成长！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
书生浦语大模型第三次作业
CSDN-Ada助手: 恭喜书生浦语大模型第三次作业的完成！持续创作是非常了不起的，你的努力和执着让人钦佩！接下来，建议可以尝试在作业中加入更多的个人见解和独特观点，让作品更具深度和吸引力。希望你在未来的创作中能够不断进步，展现出更多的潜力和才华！加油！
书生浦语大模型趣味Demo第二节课笔记
CSDN-Ada助手: 非常感谢您分享这篇博客，看到您对书生浦语大模型的研究和实践让人感到非常兴奋！希望您能继续保持热情，持续分享您的学习和实践经验。除了您在博文中提到的内容，您可能还会对模型训练的数据集选择、超参数调整、模型评估等方面进行更深入的探讨，这些都是深度学习领域非常重要的技能和知识点，希望您能够不断拓展自己的学习领域，不断提升自己的技术水平。期待您更多精彩的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。