- 博客(1)
- 收藏
- 关注
原创 海量数据Topk及重复问题
//大数据时代,查找效率最高怎么办,如查询10000个数中最大的100个数; //1.排序中最快的是快速排序,时间复杂度为o(nlogn),将10万个数全排序,不好 //2.局部淘汰,构建容量100的数组,将前100个放入,后面的如果有的数比前一百个最小的大,就替换 //3.分治算法。分为10个组,每组1000个,选出每组的前100个,怎么选:首先快速排序,分为2个堆,如果大堆大于
2015-10-25 22:09:44 1118
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人