java大数据部分笔记
文章平均质量分 85
主要以大数据在java中的应用,穿插于hadoop整个生命周期
隐 风
你知道得越多,你不知道的也就越多。
展开
-
kafka入门必备知识
Kafka是一个分布式流处理平台: 1. 可以让你发布和订阅流式的记录。这一方面与消息队列或者企业消息系统类似。 2. 可以储存流式的记录,并且有较好的容错性。 3. 可以在流式记录产生时就进行处理。原创 2023-03-24 22:50:12 · 467 阅读 · 0 评论 -
【云原生】简单谈谈分布式存储组件HBase
是一个非关系型数据库(稀疏矩阵)关系型数据库有固定的列,每一列的数据类型明确非结构化数据,半结构化数据。存储的目标数据数据量大结构简单基于key的快速查找能力可以面向列进行查询为什么要有hbase,为什么不用hdfs因为hdfs适用的场景是海量的数据批读写,不支持海量数据中的个别数据修改而Hbase支持在海量数据中,修改某一个数据。Hbase的快,是相对于hdfs来说的。...原创 2022-07-30 20:34:25 · 732 阅读 · 0 评论 -
【云原生】简单谈谈zookeeper的理解
Zookeeper是针对大型分布式系统的高可靠的协调系统,如dubbo里面的注册中心、分布式锁等,主要应用于分布式系统中原创 2022-07-07 22:32:46 · 1027 阅读 · 2 评论 -
【云原生】简单谈谈海量数据采集组件Flume的理解
flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(比如文本、HDFS、Hbase等)的能力 ...原创 2022-07-02 06:00:00 · 1103 阅读 · 3 评论