Annoy近邻算法
随机选择两个点,以这两个节点为初始中心节点,执行聚类数为2的kmeans过程,最终产生收敛后两个聚类中心点
二叉树底层是叶子节点记录原始数据节点,其他中间节点记录的是分割超平面的信息
基于Annoy算法,我们在高位空间求近邻会获得较大的性能提升,此前我们设计的聚类算法由于相对较大的时间复杂度可行性较低,我们计划用Annoy近邻算法实现关键词泛化功能。
python语法感悟
- python中的运算不止可以作用于数字,也可以作用于数组。这让python语言在科学计算上更具竞争力
a = [1.0, 2.0]
b = [1.5, 2.5]
c