海盐味哈根达斯-CSDN博客

原创 Hbase

整体结构和架构逻辑结构物理存储结构数据模型：1）Name Space命名空间，类似于关系型数据库的 DatabBase 概念，每个命名空间下有多个表。HBase有两个自带的命名空间，分别是 hbase 和 default，hbase 中存放的是 HBase 内置的表，default 表是用户默认使用的命名空间。2）Region类似于关系型数据库的表概念。不同的是，HBase 定义表时只需要声明列族即可，不需要声明具体的列。这意味着，往 HBase 写入数据时，字段可以动态、按需指定。因此

2021-04-08 10:23:46 169

原创 kafka

kafka总体架构1）producer:生产消息，给kafka broker发送消息的客户端2）consumer：消xiaoxi费消息，向kafka broker取消息的客户端3）consumer group（cg）：消费者组，由多个消费者组成。一个消费者组是逻辑上的一个订阅者，consumer group下订阅的topic下的每个分区只能分配给某个group下的一个consumer(当然该分区还可以被分配给其他group)。**4) broker：**一台kafka服务器，一个broker可以容

2021-04-07 16:07:59 119

原创 MapReduce框架原理

目录总框架数据输入job提交源码切片机制FileInputFormat切片机制CombineTextInputFormat切片机制FileInputFormat 实现类TextInputFormat(默认实现类)CombineTextInputFormatKeyValueTextInputFormatNLineInputFormat自定义MapTask阶段shuffle机制ReduceTask阶段数据输出总框架　准备map处理的输入数据 -》mapper处理-》Shuffle-》Reduce处理-》

2021-02-25 18:36:19 128

原创 Hadoop-HDFS（读写）数据流程

这里写自定义目录标题文件写入读文件Namenode 和Secondnamenode2NN机制Fimage和Edits故障处理Datanode副本节点选择(hadoop2.7.2)文件写入1）客户端通过Distributed FileSystem模块向NameNode请求上传文件，NameNode检查目标文件是否已存在，父目录是否存在。2）NameNode返回是否可以上传。3）客户端请求第一个 Block上传到哪几个DataNode服务器上。4）NameNode返回3个DataNode节点，分别为

2021-02-22 16:58:09 291

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人