快速最近邻搜索算法
常用的快速最近邻搜索算法汇总
cute_Lily
这个作者很懒,什么都没留下…
展开
-
局部敏感哈希(Locality-Sensitive Hashing, LSH)
局部敏感哈希是工程实际中主流的快速 Embedding 向量最近邻搜索方法,它属于近似最近邻查找(Approximate Nearest Neighbor, ANN)的一种。1 局部敏感哈希的基本原理局部敏感哈希的基本思想是:让相邻的点落入同一个“桶”中,在进行最近邻搜索时,只需要在一个桶,或者相邻的几个桶内进行搜索。LSH 算法基本原理是:用一个Hash 方法将数据从原空间映射到一个新的空间中,使得在原空间相似(距离近)的数据,在新的空间中也相似的概率很大,而在原空间不相似(距离远)的数据,在新的原创 2020-10-18 18:08:03 · 10215 阅读 · 0 评论 -
KD树(K-Dimension Tree)
当训练集很大时,计算输入实例和每个训练样本的距离既耗费资源又费时,为了提高 kkk 近邻搜索的效率,可以使用一些特殊的结构存储训练数据来减少计算距离的次数,如KD 树。KD 树(K-Dimension Tree)是对数据点在 kkk 维空间中划分的一种数据结构,主要应用于多维空间关键数据的搜索(如范围搜索和最近邻搜索)。本质上说,KD树就是一种平衡二叉树。范围查询 就是给定查询点和查询距离的阈值,从数据集中找出所有和查询点距离小于阈值的数。K近邻查询 是给定查询点和正整数 KKK,从数据集中找到距离原创 2020-10-18 15:57:47 · 1248 阅读 · 0 评论