性能赶超GPT-4！多模态检索最新成果刷爆SOTA！顶会思路确定不学？

深度之眼

于 2024-10-08 18:54:09 发布

阅读量857

点赞数 5

分类专栏：人工智能干货深度学习干货文章标签：人工智能机器学习深度学习多模态

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42645636/article/details/142766514

版权

关注各大顶会的同学们都知道，今年多模态相关的主题可谓是火爆非常，有许多突破性成果被提出，比如最新的多模态检索增强框架MORE，生成性能猛超GPT-4！

再比如多模态检索模型MARVEL，在所有基准上实现SOTA！可见相比传统单一模态检索，这种多模态检索更具优势，不仅能提供更全面、更准确的检索结果，也能帮助我们提升工作效率。

目前多模态检索逐渐成为了研究焦点，因为它的全面性、准确性和灵活性在多个领域（比如图像检索、医疗诊断等）都很有用武之地，是个拥有广泛应用前景的热门方向。

因此对论文er来说，这也是个很好的发文选择。为了帮助各位快速了解这个方向的最新动态，我整理好了10篇多模态检索今年最新的论文给各位作参考，代码基本都有。

论文原文+开源代码需要的同学看文末

MORE: Multi-mOdal REtrieval Augmented Generative Commonsense Reasoning

方法：论文提出了一种多模态检索增强框架MORE，通过结合文本和图像增强语言模型的常识能力，填补了现有研究在有效利用视觉数据方面的空白；采用跨注意力机制和软提示技术，从多模态检索结果中提取有用信息，并在CommonGen任务中显著提升了生成性能，超越了GPT-3.5和GPT-4。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。