大数据处理架构Hadoop
Hadoop简介: Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了系统底层细节透明的分布式基础架构。Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价的计算机集群中。Hadoop的核心是分布式文件系统HDFS和MapReduce。
Hadoop特性:
- 高可靠性
- 高效性
- 高扩展性
- 高容错性
- 成本低
- 运行在Linux平台
- 支持多种编程语言
Hadoop生态系统: 除了核心的 HDFS 和 MapReduce 以外,Hadoop 生态系统还包括 Zookeeper、HBase、Hive、Pig、Mahout、Sqoop、Flume、Ambari等功能组件。下面用一张图来简单介绍Hadoop生态系统。
Hadoop的安装与使用
- 操作系统选择Linux操作系统,可以通过Window安装VM或者VirtualBox虚拟机来搭建,或者装双系统来搭建。 具体Linux系统的两种安装方法,明天我会单独写一篇博客来介绍。
- Hadoop安装可以参考此网站的具体步骤喜欢点个赞哦