今天遇到这样一个问题,求一个数列的均值,但是最好不要用累加,因为可能溢出。
假设f(i)表示前i个数的均值,那么
f(i+1) = (X[1] + X[2] + ... + X[i] + X[i+1]) / (i+1)
= (X[1] + X[2] + ... + X[i]) / (i+1) + X[i+1] / (i+1)
= i / (i+1) * f(i) + X[i+1] / (i+1)
解决办法1 - 类似累加:
假设数据总长度为n,那么可以:
float avg(int* data, int n)
{
float result = 0.0;
for(int i = 0; i < n; i++)
{
result += (float)data[i]/n;
}
return result;
}
这样做的缺点是什么呢?
试想,如果n很大,以致于某些data[i]/n约等于0,或者说已经不在float的精度范围内了,怎么办呢?
解决办法2 - 动态规划:假设数列为X,长度为n,那么:
均值M = (X[1] + X[2] + ... + X[n]) / n假设f(i)表示前i个数的均值,那么
f(i+1) = (X[1] + X[2] + ... + X[i] + X[i+1]) / (i+1)
= (X[1] + X[2] + ... + X[i]) / (i+1) + X[i+1] / (i+1)
= i / (i+1) * f(i) + X[i+1] / (i+1)
这样子递推,就避免了累加溢出的问题。
同时也解决了精度问题,为什么这样说呢?虽然同样要除以一个整数(i+1),但是已经避免了大多数情况了。