OpenCompass 大模型评测实战笔记

最新推荐文章于 2024-09-28 21:20:29 发布

m0_65989999

最新推荐文章于 2024-09-28 21:20:29 发布

阅读量280

点赞数 3

文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_65989999/article/details/138155547

版权

OpenCompass是一个由上海人工智能实验室开发的大模型开源开放评测体系，旨在为大型语言模型和多模态模型提供全面的评测服务。该评测体系的主要特点包括开源可复现、全面的能力维度评估、丰富的模型支持、分布式高效评测、多样化的评测范式和灵活的拓展性。

OpenCompass的评测对象主要是语言大模型和多模态大模型，包括基座模型和对话模型。它从语言、知识、理解、推理、安全等多个能力维度进行评测，并采用客观评测与主观评测相结合的方法。客观评测通过定量指标比较模型输出与标准答案的差异，而主观评测则通过模拟人类对模型回复的满意度进行评分。

为了使用OpenCompass进行评测，用户需要完成配置、推理、评估和可视化等步骤。用户可以选择要评估的模型和数据集，定义评估策略和计算后端，并生成评测报告。OpenCompass还支持自定义数据集的客观和主观评测，以及数据污染评估和大海捞针测试，以全面评估模型的性能。

此外，OpenCompass提供了丰富的工具层支持，包括分布式评测技术、提示词工程、评测数据库对接、评测榜单发布和评测报告生成等功能。它还提供了实验评估步骤和作业指导，帮助用户更好地使用该评测体系。

总的来说，OpenCompass是一个功能全面、使用灵活的大模型评测工具，对于研究人员和产品开发者来说，它提供了一个有效的平台来评估和选择适合的大型语言模型。

关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

m0_65989999 CSDN认证博客专家 CSDN认证企业博客

码龄3年

10: 原创

149万+: 周排名

16万+: 总排名

4840: 访问

: 等级

166: 积分

66: 粉丝

66: 获赞

2: 评论

73: 收藏

私信

关注

热门文章

最新评论

【无标题】书生浦语第三期作业与笔记
CSDN-Ada助手: 恭喜书生浦语第三期作业与笔记的更新！看到你持续创作，真的让人很欣慰。希望你能继续保持这种创作的热情，不断提升自己的写作水平。或许在下一篇博客中，可以尝试结合个人经历或观点，增添更多独特的内容，让读者更加期待你的下一篇作品。加油！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
轻松玩转书生·浦语大模型趣味 Demo作业
CSDN-Ada助手: 这篇博客内容丰富，让人眼前一亮！期待看到更多类似的作品，继续保持创作的热情和动力。在创建模型的过程中，除了使用浦语大模型，你还可以尝试使用其他建模软件如Blender或SketchUp，这样可以拓展你的技能和视野，让作品更加多样化。同时，学习一些关于光影和材质的知识，能够让你的模型更加生动和逼真。希望你在不断探索的道路上取得更大的进步！继续加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
第二期笔记
CSDN-Ada助手: 恭喜用户在写作道路上不断前行，第三篇博客“第二期笔记”也让读者收获颇丰。建议在下一步的创作中，可以尝试增加一些个人见解和思考，让读者更加深入地了解你的观点和想法。期待你更加精彩的作品，加油！祝你写作愉快！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
书生·浦语大模型全链路开源体系
CSDN-Ada助手: 恭喜您开启博客创作之旅！标题中的“书生·浦语大模型全链路开源体系”听起来非常专业和有深度，相信您在这个领域有着丰富的知识和经验。建议您在接下来的创作中，可以分享更多实践经验和案例分析，让读者能够更深入地了解您的专业领域。期待您的更多精彩文章！祝您博客越办越好！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。