Searching&Clustering

精准搜索方法(精确查找算法)
  基于树: 搜索树算法(深度优先搜索/回溯算法 广度优先搜索 双向广度优先搜索), 蒙特卡洛树搜索

  基于hash: hash查找

  其他: 枚举算法 A*算法


相似搜索方法(精确查找算法)
  基于树: kd树算法

  基于hash: lsh算法, 百万到千万量, 如FALCONN和NMSLIB

  基于矢量量化: pq算法, 亿级以上, 如Faiss


传统聚类
  基于划分: kmeans
  基于层次: 分解/聚合
  基于统计: EM
  基于密度: meanshift, dbscan

高维聚类
  难点: 1.距离函数难于定义
        2.基于距离的聚类可能失效(如果簇间距太小)
        3.维度高引入的计算复杂度

  基于超图:边有多点
  基于子空间聚类(特征选择): clique, optics
  基于降维(向量压缩): 自组织特征映射,PCA,多维缩放
  联合聚类: OLAP思想
 

转载于:https://my.oschina.net/igooglezm/blog/1922853

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值