多模态检索、生成和融合

多模态检索、生成和融合

多模态数据是指同源的多种模态数据,例如同一事件的图像描述、文字描述、视频或者音频描述。多模态数据间的互补信息可为相应任务提供丰富的特征表达。

  1. 多模态检索
    多模态检索,就是使用一种模态数据作为查询来检索另外一种模态数据,输入输出分别为统一实物的不同模态数据。例如,用户可以使用文本来检索相关的图片或者视频等。

多模态检索的通用框架一般是:首先提取不同模态数据的特征,其次基于这些特征表达,利用跨模态间的关系来学习不同模态的共同表示,最后基于学习到的共同表示,通过合适的策略来获得跨模态检索的结果。

  1. 多模态生成
    多模态生成,是指根据某一种模态数据,生成另外一种模态数据。目前,多模态生成已经成为非常热门的方向,不近可以通过多模态生成得到的数据解决训练数据稀少或者缺失问题,还可以生成一些启发式的数据。
    多模态生成主要包含跨域生成、跨视角生成和跨模态生成。其中跨模态生成研究最多。

  2. 多模态融合
    多模态融合是指充分挖掘多种模态数据间的互补信息,以期提高对应任务的性能。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

周扬2017

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值