一台笔记本电脑磁盘 =1 T
1PB =1000 T ,也就是1000台电脑
按顺序给出数据存储单位:bit 、Byte(字节) 、KB、MB、GB、TB、PB、EB、ZB
8个位(8个0 或 1) = 1Byte
1024Byte = 1KB
数据的格式分为三类:
结构化数据
mysql数据库的数据,就是 结构化数据
即 字段名称+字段类型 是固定的,即为 结构化数据
半结构化数据
有结构,但不固定,比如 Html、Xml、.Json
{(“zhangsan”,“女”),
(“李四”,“1234”),
(“Jack”,“hello word”),
}
非结构化数据
文本、图片、视频
Hadoop 分布式集群:
分布式:多台计算机通过网络连接在一起,但每台计算机上的工作内容及数据,是不同的。
:是指在多台不同的服务器中部署不同的服务模块,通过远程调用协同工作,对外提供服务。
分布式 :一个硬件或软件,其组件会分布在不同的计算机上,彼此之间仅仅通过网络消息传递进行通信和协调的系统。
:简单来说,就是一群独立计算机集合起来共同对外提供服务,但是对于系统的用户来说,就像是一台计算机在提供服务一样。
集群:每一个集群,他的工作内容及数据,是一样的。(无论读哪个节点,数据都是一样的)
:是指在多台不同的服务器中部署相同应用或服务模块,构成一个集群,通过负载均衡设备对外提供服务。