开源夏令营
AsianTang
关注机器学习
展开
-
网络拓扑距离的高效KNN查询
项目背景:有些应用场景下,需要快速找到某个用户在网络中拓扑距离更近(跳数少,连接延迟低,传输速率快)的K个邻居节点,即KNN(K-Nearest Neighbor Query)。用户在网络中的信息,可以编码表示成一个多维的向量,如。对于这种高维数据的索引及其上的KNN查询,以往的GIS(地理信息系统)为我们提供了许多可以借鉴的方法,如R-tree, KD-Tree, 甚至Geoha原创 2014-07-22 20:40:01 · 1746 阅读 · 0 评论 -
网络拓扑距离的高效KNN查询 (中期总结)
下面,对近期的工作进行个总结。原创 2014-08-03 12:11:53 · 846 阅读 · 2 评论 -
网络拓扑距离的高效KNN查询(结项报告)
网络拓扑距离的高效KNN查询(结项报告) 下面,对最近两个月的工作做个完整的总结。 首先,介绍下项目内容以及我们最终实现的结果。项目内容是完成对用户IP-Geo-ISP等信息的索引,以腾讯提供的更详细IP库的部分数据,千万级别用户,在上面进行KNN查找的效率不低于单机100QPS。我们最终使用自适应格子算法完成了对用户信息的编码,并分别使用随机数据和真实数据对算法效率进行了测试。对原创 2014-09-07 21:42:48 · 747 阅读 · 0 评论