论文:A Deep Hashing Technique for Remote Sensing Image-Sound Retrieval

论文:A Deep Hashing Technique for Remote Sensing Image-Sound Retrieval

跨模态图像语音哈希检索

关于网络结构

使用了三元组网络,对于anchor图片使用VGG16提取deep feature,对于pos和neg语音使用MFCC提取deep feature。两种网络都增加了全连接层+sigmoid,以及全连接层+tanh的结构来获取hash-like特征。(hash的提取使用sign函数)
在这里插入图片描述

关于负样本采样

通过距离公式计算难语音样本集,在集合中,随机取样neg。
在这里插入图片描述

关于损失函数

由三部分构成,一部分是hash-like triplets,一部分是hash-like与hash的距离,一部分是deep feature的triplet,三部分加权和构成损失函数。

使用hash特征近似化后,取hash-like值计算的triplet loss,用来使正样本对靠近,负样本对远离。
在这里插入图片描述

用来使得hash-like与hash值之间的靠的更近,因为二值

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值