这两篇主要小结在hadoop学习过程中,Linux(ubuntu)下hadoop安装与环境配置+window下开发环境的配置。
这是第一篇,主要小结hadoop在ubuntu环境下的安装与配置。
不对之处,请指正。
一、hadoop介绍
hadoop时一个分布式开源计算框架。
是当前大数据领域最炙手可热的分布式计算框架。
有志于大数据方向的同学,不可能不知道hadoop。
hadoop主要为Linux而设计,运行在Linux系统上。
hadoop包括一系列的开源包,Hive,HBase,MapReduce。
包括机器学习包Mahout(现已成为Apache的顶级项目,与hadoop平级)。
hadoop是基于java的,所以必须依赖java的JDK。
hadoop支持java、python、scala,主要的开发语言还是scala,推荐的语言也是scala。
scala是基于java的语言,类似于scala.开发基于scala的程序必须有java JDK支持。