HADOOP介绍

最新推荐文章于 2021-06-30 09:56:22 发布

pluto_peach

最新推荐文章于 2021-06-30 09:56:22 发布

阅读量200

点赞数

文章标签：大数据

本文链接：https://blog.csdn.net/weixin_45415743/article/details/102489302

版权

Hadoop是一个分布式系统基础架构，主要用于大数据的分析和处理。它包含HDFS和MapReduce核心，以及众多子项目如HBase、Hive等。Hadoop的目录结构包括bin、etc、include、lib等，用于存放脚本、配置文件和库。HDFS提供高吞吐量的数据访问，MapReduce是数据处理模型，YARN则是分布式资源调度框架。

摘要由CSDN通过智能技术生成

HADOOP

hadoop历史

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。

Hadoop 就是为了解决面向互联网及其他来源的大数据的分析和并行处理计算模型。她的诞生引起了学术界、金融界以及商业界的广泛关注。其创建之初的宗旨就是让使用者和用户能够通过使用大量普通的服务器搭建相应的服务器集群来实现大数据的并行处理能力，其优先考虑的是数据扩展性和系统的可用性。

hadoop用处

数据清洗功能
数据分析功能
数据可视化功能

hadoop项目介绍

Hadoop是一个分布式计算基础架构这把"大伞"下的相关子项目的集合。这些项目属于Apache软件基金会(http://hadoop.apache.org)，后者为开源软件项目社区提供支持。虽然Hadoop最出名的是MapReduce及其分布式文件系统(HDFS，从NDFS改名而来)，但还有其他子项目提供配套服务，其他子项目提供补充性服务。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7DW03cdE-1570707579203)(C:\Users\ou\AppData\Roaming\Typora\typora-user-images\1570706224676.png)]