本章节将重点讲述Hadoop及Hive的环境介绍,主要的内容包含有分布式文件系统[HDFS] 、分布式计算(MapReduce)、数据仓库工具(Hive)、数仓分层 等相关的知识,章节讲述的内容依然围绕3个方面:
1】是什么的问题;
2】为什么的问题;
3】怎么用的问题
1、Hadoop环境的介绍
1.1 Hadoop的介绍
通过百度百科查询【Hadoop】中可知,Hadoop是由Apache开发的分布式系统基础架构。能够充分利用集群的威力进行高速运算和存储。
Hadoop实现了一个