大数据 02 Hadoop 概述

1 介绍

官网:hadoop.apache.org

1)概念

The Apache™ Hadoop® project develops open-source software for reliable, scalable, distributed computing.

Hadoop是一个可靠的,可扩展的,分布式的计算框架。

2)包含的组件

Hadoop Common: The common utilities that support the other Hadoop modules.
Hadoop Distributed File System (HDFS™): A distributed file system that provides high-throughput access to application data.
Hadoop YARN: A framework for job scheduling and cluster resource management.
Hadoop MapReduce: A YARN-based system for parallel processing of large data sets.

  • HDFS -> 分布式文件系统,用于数据存储
  • YARN -> 工作调度和资源管理
  • MapReduce -> 并行处理数据

3)应用

  • 搜索引擎
  • 日志分析
  • 商业智能
  • 数据挖掘

4)优势

  • 高可靠性
  • 数据多副本
  • 重新调度计算
  • 高扩展性
  • 其他
  • 使用廉价机器,降低成本
  • 成熟的生态圈
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值