数学问题
田万鹏
这个作者很懒,什么都没留下…
展开
-
中位数
来自水木上的一个问题:x轴上n个点,xi求一个点x,到所有点的距离的和最小。答案:如果n是奇数,则此点是中位数点如果n是偶数,则此点是中间两点之间的任意一点。简单解法:将n个点用如下方法连接,将x1和xn连接,x2和xn-1连接,依次类推,最后,剩下中间的一个点就是x,此时上述所有连线的和就是距离和,想象x无论向左还是向右,距离都只会增加不会减少。原创 2010-11-29 19:45:00 · 348 阅读 · 0 评论 -
bloom filter中的数学问题抽象
bloom filter算法中计算错误率的时候,能够抽象出一个数学问题:问题描述如下:f(k)=k*ln(1-e^k) 求最小值上面推导过程的说明:g(x)是一个单增函数,才导致g(x) = g(1-x).关于filter的原理参见参考文献。 参考文献:1、http://blog.csdn.net/jiaomeng/archive/2007/01/27/1495500.aspx2、http://www.eecs.harvard.edu/~michaelm/postscripts/im2005b.pdf原创 2010-11-26 19:41:00 · 307 阅读 · 0 评论 -
将大小不一的一对文件组合成为大小均匀的若干文件?
hadoop集群的小文件过多是一个棘手的问题,过多的小文件作为输入的时候,会导致集群一下启动了太多的map,浪费了集群资源,同时可能会阻塞其他的任务执行。hadoop提供了一种多文件输入的方法CombineInputFormat,可以将过多的小文件合并为若干个期望大小的大文件作为原创 2011-10-03 18:23:38 · 828 阅读 · 0 评论