算法问题整理（八）

分享总结快乐

已于 2024-08-29 15:51:13 修改

阅读量198

点赞数 1

文章标签：算法

于 2024-08-19 14:00:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qingjing0413/article/details/141323785

版权

网络资料整理个人学习，感谢各位大神！（若侵则删）

问题22: 多模态大模型测试集与工具

参考：https://zhuanlan.zhihu.com/p/694361831

MMBench

主要由两个元素组成。第一个元素是精心标注的数据集，在评估问题和能力的数量和种类方面超过了现有的类似基准。第二个元素引入了一种新的 CircularEval 策略，并结合了 ChatGPT 的使用。这种实现旨在将自由形式的预测转换为预定义的选择，从而促进对模型预测的更稳健的评估。

MMStar

一个精选的、视觉内容不可或缺的多模态基准测试，包含1,500个由人工精心挑选的样本。MMStar评估6项核心能力和18个具体评估维度，旨在通过精心平衡和净化的样本，准确评估LVLMs的多模态能力。这些样本首先通过自动化流程从现有基准中粗选，随后进行人工审核，确保每个精选样本展现出对视觉的依赖性、最小化的数据泄露风险，并要求高级的多模态处理能力。

MME

提出了第一个全面的 MLLM 评估基准 MME。它在总共 14 个子任务上衡量感知和认知能力。为了避免直接使用公共数据集进行评估可能产生的数据泄漏，指令-答案对的标注都是手动设计的。

参考：

最低0.47元/天解锁文章

分享总结快乐

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

分享总结快乐 CSDN认证博客专家 CSDN认证企业博客

码龄12年

15: 原创

37万+: 周排名

8万+: 总排名

5566: 访问

: 等级

271: 积分

68: 粉丝

107: 获赞

6: 评论

70: 收藏

私信

关注

热门文章

最新评论

Linux基础-git常用操作
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Linux基础操作-使用vnc
普通网友: 优质好文，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Linux基础-ffmpeg常用的视频操作命令
CSDN-Ada助手: 恭喜您写了第三篇博客，标题为“Linux基础-ffmpeg常用的视频操作命令”！看来您对Linux和ffmpeg的了解越来越深入了。接下来，我建议您可以尝试写一些实用性更强的教程，比如如何结合ffmpeg实现视频剪辑或转码等更加高级的操作。希望您能继续保持创作的热情，为大家带来更多有用的知识分享！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
Linux基础-git常用操作
CSDN-Ada助手: 恭喜用户发布了新的博客文章！看到你分享了关于Linux基础和git常用操作的内容，我觉得很有收获。希望你能继续坚持创作，分享更多有价值的知识给大家。下一步，可以考虑深入探讨一些高级的git操作，或者分享一些Linux系统优化的经验，让我们一起学习进步吧！期待你的下一篇作品。如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Linux基础操作-添加用户
CSDN-Ada助手: 恭喜你开始了博客创作，内容也很实用！建议下一篇可以继续深入介绍Linux系统的其他基础操作，比如文件管理、权限设置等，让读者能够更全面地了解Linux系统的使用方法。希望你能够坚持更新，分享更多有趣的内容！祝你创作顺利！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。