Deep Visual-Semantic Hashing for Cross-Modal Retreival (DVSH)

会议:2016 KDD

Problem:使用DVSH以一种end-to-end的深度学习方式对图像和文本生成紧凑的哈希编码。

Contributions:1. 一个深度的视觉-语义融合网络用以在联合嵌入空间学习同构的哈希编码,从而每一个image-sentence对的表达被紧紧地融合和联系在一起。2.一个图像的哈希网络和一个句子的哈希网络,可以学习特定模态的非线性哈希函数,该哈希函数可以将图像和句子映射到联合嵌入空间中,得到紧致的哈希编码。3. 一种新的cosine最大边界loss,可以用于保持pairwise的相似性信息以及增强对outliers的鲁棒性。4.一种新的bitwise最大边界loss,用以控制binary哈希编码的质量。

Methods:


目标函数:


其中:





通过最小化cosine最大边界loss(6),可以得到鲁棒的相似性保持的表达学习;通过最小化bitwise最大边界loss(7),可以得到高质量的紧凑的binary哈希编码;通过最小化平方loss(8)-(9),可以有效、高效地生成样本外的编码。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值