- 博客(1)
- 收藏
- 关注
转载 Hadoop 及常用工具简介
Apache Hadoop是Apache的一个分布式计算开源框架,提供了一个分布式文件系统子项目(HDFS)和支持MapReduce分布式计算的软件架构那什么是MapReduce呢? 举例来说,统计一系列的文档中的词汇。文档数量规模很大,有1000万个文档,英文单词的总数可能只有3000。那么input M=10000000,output N=3000.于是我们搞了10000个PC做Mapp...
2018-06-08 21:10:26 2876
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人