黑马Hadoop

本文介绍了Hadoop分布式集群的概念,包括数据存储单位和数据类型。重点讲解了Hadoop中的Zookeeper如何保证集群数据一致性,并在主节点宕机时进行故障转移。同时,提到了HDFS的组成部分如Namenode、Datanode和SecondNamenode,以及Namenode的元数据存储和副本机制。
摘要由CSDN通过智能技术生成

一台笔记本电脑磁盘 =1 T
1PB =1000 T ,也就是1000台电脑

按顺序给出数据存储单位:bit 、Byte(字节) 、KB、MB、GB、TB、PB、EB、ZB
8个位(8个0 或 1) = 1Byte
1024Byte = 1KB


数据的格式分为三类:
结构化数据
mysql数据库的数据,就是 结构化数据
即 字段名称+字段类型 是固定的,即为 结构化数据

半结构化数据
有结构,但不固定,比如 Html、Xml、.Json
{(“zhangsan”,“女”),
(“李四”,“1234”),
(“Jack”,“hello word”),
}

非结构化数据
文本、图片、视频


Hadoop 分布式集群:
分布式:多台计算机通过网络连接在一起,但每台计算机上的工作内容及数据,是不同的。
:是指在多台不同的服务器中部署不同的服务模块,通过远程调用协同工作,对外提供服务。
分布式 :一个硬件或软件,其组件会分布在不同的计算机上,彼此之间仅仅通过网络消息传递进行通信和协调的系统。
:简单来说,就是一群独立计算机集合起来共同对外提供服务,但是对于系统的用户来说,就像是一台计算机在提供服务一样。

集群:每一个集群,他的工作内容及数据,是一样的。(无论读哪个节点,数据都是一样的)
       :是指在多台不同的服务器中部署相同应用或服务模块,构成一个集群,通过负载均衡设备对外提供服务。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值