使用Hadoop的MapReduce与HDFS处理数据
hadoop是一个分布式的基础架构,利用分布式实现高效的计算与储存,最核心的设计在于HDFS与MapReduce,HDFS提供了大量数据的存储,mapReduce提供了大量数据计算的实现,通过Java项目实现hadoop job处理海量数据解决复杂的需求。
一、基本环境及相关软件的配置
详细配置说明:基本环境配置及权限申请
二、hadoop项目开发流程
hadoop主要的
原创
2014-11-19 16:16:26 ·
7966 阅读 ·
0 评论