多模态语义分析_基于概率潜在语义分析的多模态图像检索方法研究与实现_问答库...

最新推荐文章于 2024-04-16 09:14:38 发布

weixin_39943202

最新推荐文章于 2024-04-16 09:14:38 发布

阅读量209

点赞数

文章标签：多模态语义分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39943202/article/details/112032020

版权

随着互联网和数字设备的普及与发展，互联网上的图像等多媒体数据飞速增长。如何从海量数据中迅速检索出符合人们意图的图像已经成为当下的研究热点。基于文本的图像检索仅仅通过图像的相关文本进行检索，没有利用图像内容，而基于内容的图像检索由于受到语义鸿沟的困扰，其检索性能仍然无法令人满意。为了缩小语义鸿沟，研究者们提出了多模态图像检索方法，通过融合图像的文本信息和底层特征进行检索，但是如何实现两种信息的有效融合仍然是现在的研究难点。针对这一问题，本论文研究基于概率潜在语义分析的多模态图像检索。

为了有效地融合不同模态的信息，本文首先提出了基于概率潜在语义分析的无监督多模态图像检索方法。该算法将潜在主题扩展为关于文本单词和图像视觉单词的联合分布，从而实现了文本信息和图像底层特征的有效融合。该算法可以广泛地应用于各种具有文字标注信息的多模态图像检索场景，比如web多模态检索等。由于概率潜在语义分析对初值比较敏感，收敛时间过长，本文在无监督算法的基础上，提出利用数据集中的类别信息对算法进行初始化，有效地降低了算法的训练时间，并进一步提高了检索准确度。该算法适用于特定领域的带有类别标注的多模态图像检索。最后，利用论文提出的多模态图像检索算法实现了多模态图像检索系统，该系统验证了算法的正确性与实用性。

论文为多模态图像检索提供了一种有效融合图像文本信息和底层特征的方法，对改善图像检索性能起到了积极的作用。

weixin_39943202

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
多模态语义分析_基于概率潜在语义分析的多模态图像检索方法研究与实现_问答库...

随着互联网和数字设备的普及与发展，互联网上的图像等多媒体数据飞速增长。如何从海量数据中迅速检索出符合人们意图的图像已经成为当下的研究热点。基于文本的图像检索仅仅通过图像的相关文本进行检索，没有利用图像内容，而基于内容的图像检索由于受到语义鸿沟的困扰，其检索性能仍然无法令人满意。为了缩小语义鸿沟，研究者们提出了多模态图像检索方法，通过融合图像的文本信息和底层特征进行检索，但是如何实现两种信息的有效融...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。