在讨论区中看到的,感觉不错记录下来。
1)关于算法,我想了一个简单的思路,分治+递归:
1、设置一个余数区pub,初始为0。
2、每N(N=100)个数取均值。计算时将公共余数pub计入。所得整数部分作为均值,余数部分设为余数区。
3、计算下一组N个数,计算方法同上。
4、将10亿个数计算完毕后,将余下10亿/100=1000万个数。
5、将余数区内的值pub/N,重新记入余数区。
重复1~5,进行递归计算,其中N可以动态规划。假设N一直为100,则进行4次计算后,则余下了10个数及1个余数。
整体上,数据访问的次数将控制在约1.01次,时间复杂度也相对较小。
同时,由于分组的方法,该算法可以做多线程/分布式。
2)如果可以知道预估的平均数,对每个数减去一个预估的平均数,然后求和。
这样和就在0附近了,然后结果再加回去。