- 博客(5)
- 收藏
- 关注
原创 Scala——函数Currying
在计算机科学中,柯里化(Currying)是把接受多个参数的函数变换成接受一个单一参数(最初函数的第一个参数)的函数,并且返回接受余下的参数且返回结果的新函数的技术。
2016-12-24 11:01:14 543
原创 Spark——二次排序(scala)
Spark实现二次排序的两个版本(Scala): (1)利用分组,手动将第二个元素按规则排序 (2)自定义数据类型,继承Ordered和Serializable接口,实现compare方法。
2016-12-23 11:04:39 1084
原创 回顾——MapReduce计算模型
上一节我们回顾了HDFS文件系统,以及其架构原理。那么在这一节,我们来介绍Hadoop的离线计算模型——MapReduce,并以wordcount程序为例详细讲解。
2016-12-16 12:47:46 3071
原创 回顾——HDFS文件系统
上一节我们介绍了Hadoop是什么,以及包括哪些模块,本节开始我们分别详细介绍HDFS,MapReduce和YARN。由于HDFS是整个Hadoop的中流砥柱,而且也是部署集群时最先配置的模块,所以我们先介绍HDFS。
2016-12-13 22:43:18 505
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人