大数处理问题汇总
1、找出中位数思想: 划分区间,遍历数组将对应的数据放在对应的桶中,并统计每个桶中的元素数量,只要两次读取全部的数据就可以重点/细节: (1)、两次读取数据,第一次划分区间划分的比较细,第二次划分就可以粗一点划分区间的思想另外一个应用:找出最大的重复的URL\IP\WORLD,首先就是进行一个映射hash(因为对字符无法进行大小的划分,数字最好),然后进行大区间的划分,再划分更小的区间。(2)、对数据的大小以及内存的计算(1G=10^9byte 1亿=10^8),具体的计算可以看这个,里面还有
原创
2020-10-19 15:45:10 ·
927 阅读 ·
0 评论