- 博客(1)
- 收藏
- 关注
原创 [论文阅读] CLIP-based fusion-modal reconstructing hashing for large-scaleunsupervised cross-modal retri
随着多媒体数据的快速增长,单一的数据检索方式已经不能满足信息需求。跨模态检索是利用一种模态的数据作为查询来检索另一种模态的相关数据,如用户可以通过文本检索图像、音频和视频等,已受到研究者的广泛关注。由于不同模态数据之间存在异质性差距和语义差距,如何量化不同模态数据之间的相似度是跨模态检索的主要障碍。早期的一些方法使用人工标签来度量不同模态数据之间的相似性,但由于巨大的人工成本和噪声问题,这些方法并不适用于实际场景。
2024-04-26 15:09:38
1019
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人