多模态数据集预处理方法

摘要

对文本是单个词语的一般采用词袋特征
图片可以采用多种灵活的处理方式
对文本是句子甚至是段落的则需要采用较为复杂的处理方式,参考文献[1-2]中对Wiki和Pascal Sentence数据集的处理方式

Wiki

在这里插入图片描述
参考文献
[1] Wang D, Gao X, Wang X, et al. Multimodal discriminative binary embedding for large-scale cross-modal retrieval[J]. IEEE Transactions on Image Processing, 2016, 25(10): 4540-4554.

在这里插入图片描述
参考文献
[2] Wei Y, Zhao Y, Lu C, et al. Cross-modal retrieval with CNN visual features: A new baseline[J]. IEEE transactions on cybernetics, 2016, 47(2): 449-460.

MIRFlickr

在这里插入图片描述
参考文献
[1] Wang D, Gao X, Wang X, et al. Multimodal discriminative binary embedding for large-scale cross-modal retrieval[J]. IEEE Transactions on Image Processing, 2016, 25(10): 4540-4554.
注:DCMH中对文本数据的描述有误,以此处描述为准

Pascal Sentence

在这里插入图片描述
参考文献
[2] Wei Y, Zhao Y, Lu C, et al. Cross-modal retrieval with CNN visual features: A new baseline[J]. IEEE transactions on cybernetics, 2016, 47(2): 449-460.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值