Hadoop笔记(组成、特点、相关)

Hadoop组成:
1.HDFS(Hadoop Distributed File System)
说明:分布式文件系统。
作用:存储海量数据
特点:高容错、高数据吞吐量
2.MapReduce:
说明:并行处理大数据集的Yarn基本系统。
作用:计算海量数据
3.Yarm:
作用:资源管理和任务调度的一个框架
4.Common:
作用:支撑其他模块。

Hadoop特点:
1.高可扩展性。
说明:hadoop可存储和分布横跨数百个并行操作的廉价服务器数据集群,能可靠的存储和处理PB数据。
2.成本效益好。
说明:hadoop提供了极具成本效益的存储解决方案,高效且实惠地解决了数据的存储和计算的问题。
3.灵活性好:
说明:hadoop帮助企业轻松地访问数据,访问目标多样化。
4**.hadoop高效性:**
说明:hadoop以其独特的存储方式,能够快速的进行数据处理。
5.容错率高:
说明:容错率高是hadoop一个极为关键的优势,hadoop能自动地维护数据的多份副本,一般默认为三份,一旦某个节点上的数据损坏或丢失,立即将失败的任务重新分配。并且在任务失败后能够自动重新部署计算机任务。

Hadoop相关项目:
1.Hbase:
说明:分布式且开源的数据库,NoSQL。
作用:解决非关系型数据存储问题
2.Hive:
说明:基于hadoop体系结构的数据仓库基础构架,可以将结构化的数据文件映射成数据库表并提供查询语句。
作用:一种可存储、查询、分析并存储在hadoop中的大规模数据处理的机制。
3.Spark:
说明:一个快速和通用的集群计算机系统。支持一组丰富的高级工具,包括Spark SQL、SQL和结构化数据处理、Spark流等。
4.Zookeeper:
说明:一个能高效开发和维护分布式的开源码的应用协调服务。
作用:为分布式应用提供一致性服务的软件,提供维护配置信息、名字服务、分布式同步、组服务等。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值