在数周前所发表的博文《大数据下的TopK算法》中介绍了求解大数据时代中几乎是最为经典的TopK的过程。虽然大数据技术使得大规模数据下的TopK问题得到了有效的解决,但是对于一些该问题的拓展,单单靠大数据技术是无法获得令人满意的解决方案。本文所述的多维数据下的TopK问题就是这一类问题。如果该算法直接采用现有的TopK解决方案,那么一次又一次的运行大数据的过程将会使算法的求解变得令人感到无比繁琐且尴尬。
更多信息,参见作者个人主页Jianping Cai's Research Page。
在数周前所发表的博文《大数据下的TopK算法》中介绍了求解大数据时代中几乎是最为经典的TopK的过程。虽然大数据技术使得大规模数据下的TopK问题得到了有效的解决,但是对于一些该问题的拓展,单单靠大数据技术是无法获得令人满意的解决方案。本文所述的多维数据下的TopK问题就是这一类问题。如果该算法直接采用现有的TopK解决方案,那么一次又一次的运行大数据的过程将会使算法的求解变得令人感到无比繁琐且尴尬。
更多信息,参见作者个人主页Jianping Cai's Research Page。