- 博客(2)
- 收藏
- 关注
原创 基于欧式距离的海量高维向量相似度计算方法综述及局部敏感哈希 Cross-polytope LSH 简介
在做海量高维向量相似度快速计算比赛时,对最近邻搜索方法做了一些泛读和总结。主要以下分为几大类。 一是基于树形的高维索引,如kd-tree,R-tree等,但当维度较高时,查询性能急剧下降。 二是基于map-reduce方法,选择合适个数的中心点,相当于一个聚类操作,将一个中心点定义为一个cell。使用多个计算节点将查找集和被查找集同时映射到距离最近的中心点,也就是对应的cell...
2018-07-13 12:07:51 5289 3
原创 [leetcode]堆排序 求前k大的数
前一篇博客中写到了排序算法,其中包含一个堆排序,因此本篇博客讲解堆这个数据结构及其应用。关于最大堆最小堆以及初始建堆和整理堆在上篇博客中有提及,此处不再赘述。下面讲解一个堆的重要应用,求n个数中前k个大的数,一般思路是将n个数排序,取前k个数,但当n的数量庞大无法加载到内存时,需要另外一种思路,即利用堆,只维护k个树的大小而不需维护全部。具体的思路是:先建一个k个数的小堆,然后从k+1个数往后的值...
2018-07-13 11:20:17 5750
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人