【Similarity Search】
文章平均质量分 79
JasonDing1354
关注jasonding.top
展开
-
典型位置敏感哈希的相似性搜索的研究
本文就Locality Sensitive Hashing的典型算法及变型做一概述说明原创 2014-06-25 17:07:34 · 2087 阅读 · 0 评论 -
【E2LSH源码分析】p稳定分布LSH算法初探
对应海明距离的LSH称为位采样算法(bit sampling),该算法是比较得到的哈希值的海明距离,但是一般距离都是用欧式距离进行度量的,将欧式距离映射到海明空间再比较其的海明距离比较麻烦。于是,研究者提出了基于p-稳定分布的位置敏感哈希算法,可以直接处理欧式距离,并解决(R,c)-近邻问题。原创 2014-07-29 22:01:19 · 13760 阅读 · 10 评论 -
【E2LSH源码分析】E2LSH源码综述及主要数据结构
E2LSH的核心代码可以分为3部分:LocalitySensitiveHashing.cpp——主要包含基于LSH的RNN(R-near neighbor)数据结构。其主要功能是根据参数构建数据结构进行查询数据对象的功能;BucketHashing.cpp——主要包含对于哈希桶的普通哈希表。其主要功能是构建哈希表,添加哈希桶到表中和查询哈希桶;SelfTuning.cpp——包含计算RNN数据结构最佳参数的函数。原创 2014-08-01 21:27:31 · 4304 阅读 · 0 评论 -
【E2LSH源码分析】E2LSH函数接口
上一小节,我们对E2LSH代码主要的源码框架和用到的数据结构作了简单介绍(http://blog.csdn.net/jasonding1354/article/details/38331229),这一节我将简单介绍一下E2LSH的主要函数接口。原创 2014-08-04 20:13:56 · 3634 阅读 · 0 评论 -
【E2LSH源码分析】LSH算法框架分析
最近邻问题(nearest neighbor problem)可以定义如下:给定n个对象的集合并建立一个数据结构,当给定任意的要查询对象时,该数据结构返回针对查询对象的最相似的数据集对象。LSH的基本思想是利用多个哈希函数把高维空间中的向量映射到低维空间,利用低维空间的编码来表示高维向量。通过对向量对象进行多次哈希映射,高维向量按照其分布以及自身的特性落入不同哈希表的不同桶中。在理想情况下可以认为在高维空间中位置比较接近的向量对象有很大的概率最终落入同一个桶中,而距离比较远的对象则以很大的概率落入不同的桶中原创 2014-07-28 22:09:06 · 7946 阅读 · 2 评论 -
【Similarity Search】Multi-Probe LSH算法深入
引言上一小节中,我们初步介绍了Multi-Probe LSH算法的大致思路,为了不显得博客文章太冗杂,所以将这个话题分成几篇文章来写。在该小节文章中,我将具体介绍一下生成微扰向量序列(a sequence of perturbation vectors)的方法及相关分析。步进式探测(Step-Wise Probing)n-step微扰向量Δ有n个非零坐标,根据位置敏原创 2015-03-08 21:55:42 · 2726 阅读 · 0 评论 -
互联网相似图像识别检索引擎 —— 基于图像签名的方式
一、引言 多媒体识别是信息检索中难度较高且需求日益旺盛的一个问题。以图像为例,按照图像检索中使用的信息区分,图像可以分为两类:基于文本的图像检索和基于内容识别的图像检索(CBIR:Content Based Image Retrieval)。基于文本的图像检索完全不分析和利用图像本身的内容,其检索质量完全依赖于与图像关联的文字信息与图像内容的相关性,因此有必要引入基于内容的图像检索。本为主转载 2015-04-22 11:02:53 · 3467 阅读 · 1 评论