简单了解 Hadoop、HDFS、Kudu、Parquet

本文介绍了Hadoop及其组件HDFS、Parquet和Kudu。Hadoop是分布式分析应用的开源框架,HDFS是其分布式文件系统,适合处理大规模数据。Parquet是列式存储格式,提升查询效率。Kudu则结合了行存和列存的优点,支持高效随机读写及数据分析。
摘要由CSDN通过智能技术生成

简单了解 Hadoop、HDFS、Kudu、Parquet

前言

提示:最近简单了解了一些大数据的常用组件,记录一下自己的理解。

一、Hadoop

Hadoop 是由 java 语言编写的,在分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架,其核心部件是 HDFS 与 MapReduce。

HDFS 为海量的数据提供了存储,而 MapReduce 为海量的数据提供了计算:
可以把 HDFS 理解为一个分布式的,有冗余备份的,可以动态扩展的用来存储大规模数据的大硬盘;

把 MapReduce 理解成为一个计算引擎,按照 MapReduce 的规则编写 Map 计算 Reduce 计算的程序,可以完成计算任务。在这里插入图片描述

二、HDFS

HDFS 是 Hadoop 项目的一个子项目,是 Hadoop 应用下的分布式文件系统,引入存放文件元数据信息的服务器 Namenode 和实际存放数据的服务器 Datanode,对数据进行分布式储存和读取。

提示:分布式文件系统(Distributed File System,DFS)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点(可简单的理解为一台计算机)相连;或是若干不同的逻辑磁盘分区或卷标组合在一起而形成的完整的有层次

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值