- 博客(4)
- 资源 (1)
- 收藏
- 关注
转载 深度分析如何在Hadoop中控制Map的数量
深度分析如何在Hadoop中控制Map的数量[email protected]很多文档中描述,Mapper的数量在默认情况下不可直接控制干预,因为Mapper的数量由输入的大小和个数决定。在默认情况下,最终input占据了多少block,就应该启动多少个Mapper。如果输入的文件数量巨大,但是每个文件的size都小于HDFS的blockSize,那么会造
2016-05-23 16:53:06 455
原创 347. Top K Frequent Elements
桶排序这玩意,真是需要时刻留心啊。此外,堆排序,建堆时间复杂度为O(n),堆排序中剃掉top并调整堆的时间复杂度为log(n)。
2016-05-16 10:25:03 355
转载 关于知行合一
关于知行合一,先生在《传习录》中有阐释:“未有知而不行者。知而不行,只是未知。.......有如知痛,必已自痛了,方知痛。知寒,必已自寒了。知饥,必已自饥了。知行如何分得开?” “今人却就将知行分作两件去做,以为必先知了,然后能行。故遂终身不行,亦遂终身不知。”当时读到这段如醍醐灌耳。今人做事,绝大多先立志而后行,我亦属于那范畴,以致说多做少,最终落空。知行合一是为良剂,知不弃行,
2016-05-15 21:35:39 1198
转载 Variance-Covariance Matrix
This lesson explains how to use matrix methods to generate a variance-covariance matrix from a matrix of raw data.VarianceVariance is a measure of the variability or spread in a set of data. M
2016-05-02 22:04:12 4929
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人