实战营学习笔记7

最新推荐文章于 2024-07-10 22:11:08 发布

weixin_46643868

最新推荐文章于 2024-07-10 22:11:08 发布

阅读量445

点赞数 12

文章标签：学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46643868/article/details/140000290

版权

OpenCompass ：是骡子是马，拉出来溜溜开源可复现：提供一个公平、公开、可复现的评测方案，确保评测的透明度和公正性。
全面的能力维度：设计了五大能力维度，涵盖70多个数据集和约40万题，全面评估模型的各方面能力。
丰富的模型支持：支持20多个HuggingFace及API模型，具有广泛的适用性。
分布式高效评测：通过简单的命令实现任务分割和分布式评测，大幅提高评测效率。
多样化评测范式：支持零样本、小样本及思维链评测，结合不同的提示词模板，激发模型的最大性能。
灵活化拓展：系统设计允许用户轻松添加新模型、数据集或自定义任务分割策略。
评测对象主要包括基座模型和对话模型，前者通过自监督学习训练，后者则在基座模型基础上进行指令微调和人类偏好对齐。

工具架构分为模型层、能力层、方法层和工具层，其中能力层从通用能力和特色能力两个方面进行评测设计，方法层结合客观评测和主观评测两种方式。

设计思路基于通用人工智能的角度，结合学术和工业界的进展和实践，提出面向实际应用的模型能力评价体系。

评测方法结合了客观评测和主观评测，客观评测通过定量指标比较模型输出与标准答案的差异，主观评测则依赖于人的主观感受，通过受试者的评分来评估模型的真实能力。

weixin_46643868

关注

12
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
实战营学习笔记7

评测方法结合了客观评测和主观评测，客观评测通过定量指标比较模型输出与标准答案的差异，主观评测则依赖于人的主观感受，通过受试者的评分来评估模型的真实能力。OpenCompass ：是骡子是马，拉出来溜溜开源可复现：提供一个公平、公开、可复现的评测方案，确保评测的透明度和公正性。工具架构分为模型层、能力层、方法层和工具层，其中能力层从通用能力和特色能力两个方面进行评测设计，方法层结合客观评测和主观评测两种方式。分布式高效评测：通过简单的命令实现任务分割和分布式评测，大幅提高评测效率。
复制链接

扫一扫

weixin_46643868 CSDN认证博客专家 CSDN认证企业博客

码龄4年

13: 原创

13万+: 周排名

8万+: 总排名

5027: 访问

: 等级

250: 积分

103: 粉丝

120: 获赞

0: 评论

22: 收藏

私信

关注

热门文章

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。