论文：A Deep Hashing Technique for Remote Sensing Image-Sound Retrieval

最新推荐文章于 2024-09-07 21:36:31 发布

gegeai5

最新推荐文章于 2024-09-07 21:36:31 发布

阅读量406

点赞数

文章标签：神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gegeai5/article/details/106378922

版权

论文：A Deep Hashing Technique for Remote Sensing Image-Sound Retrieval

跨模态图像语音哈希检索

跨模态图像语音哈希检索

关于网络结构

使用了三元组网络，对于anchor图片使用VGG16提取deep feature,对于pos和neg语音使用MFCC提取deep feature。两种网络都增加了全连接层+sigmoid,以及全连接层+tanh的结构来获取hash-like特征。（hash的提取使用sign函数）

关于负样本采样

通过距离公式计算难语音样本集，在集合中，随机取样neg。

关于损失函数

由三部分构成，一部分是hash-like triplets,一部分是hash-like与hash的距离，一部分是deep feature的triplet，三部分加权和构成损失函数。

使用hash特征近似化后，取hash-like值计算的triplet loss，用来使正样本对靠近，负样本对远离。

用来使得hash-like与hash值之间的靠的更近，因为二值

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文：A Deep Hashing Technique for Remote Sensing Image-Sound Retrieval

论文：A Deep Hashing Technique for Remote Sensing Image-Sound Retrieval跨模态图像语音哈希检索关于网络结构关于负样本采样关于损失函数实验结果跨模态图像语音哈希检索关于网络结构使用了三元组网络，对于anchor图片使用VGG16提取deep feature,对于pos和neg语音使用MFCC提取deep feature。两种网络都增加了全连接层+sigmoid,以及全连接层+tanh的结构来获取hash-like特征。（hash的提取使用s
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。