- 博客(3)
- 收藏
- 关注
原创 day three
1、Namenode Namenode是整个文件系统的管理节点。它维护着整个文件系统的文件目录树,文件/目录的元信息和每个文件对应的数据块列表, 接收用户的操作请求。 文件包括: ①fsimage:元数据镜像文件。存储某一时段NameNode内存元数据信息。 ②edits:操作日志文件。 ③fstime:保存最近一次checkpoint的时间 以上这些文件是保存在linux
2018-01-24 20:00:46 196
原创 大数据学习第二天
1.CAP理论BASE理论分布式领域CAP理论,分布式领域CAP理论,Consistency(一致性), 数据一致更新,所有数据变动都是同步的Availability(可用性), 好的响应性能Partition tolerance(分区容忍性) 可靠性定理:任何分布式系统只可同时满足二点,没法三者兼顾。忠告:架构师不要将精力浪费在如何设计能满足三者的完美分布式系统,而是应该
2018-01-23 19:54:25 170
原创 大数据
一.大数据的定义:大数据就是对规模巨大的的分析,拥有数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)四个v的特点。六个基本方面1. Analytic Visualizations(可视化分析) 不管是对数据分析专家还是普通用户,数据可视化是数据分析工具最基本的要求。可视化可以直观的展示数据,让数据自己说话,让观众听到结果。2.
2018-01-22 19:15:54 372
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人