Hadoop
zjj_daniu
这个作者很懒,什么都没留下…
展开
-
Hadoop笔记2 HDFS
HDFS 在一个操作系统中可能存不下海量的数据,那么可以将其分配到更多的操作系统管理的磁盘中,但是不方便管理和维护。 分布式文件管理系统可以管理多台机器上的文件,HDFS就是一种分布式文件管理系统。 HDFS:Hadoop Distributed File System 它是一个文件系统,用于存储文件,通过目录树来定位文件,其次,它是分布式的,由很多台服务器联合起来实现其功能,集群中的服务器有各自的角色。 适合一次写入,多次读取的场景,不支持文件的修改。 优点: 高容错(副本机制) 适合处理大数据 可构建在原创 2020-05-25 10:57:29 · 14413 阅读 · 0 评论 -
Hadoop笔记1 Hadoop架构
大数据 大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。 4V:(Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)) Hadoop hadoop是apach原创 2020-05-24 15:41:38 · 14519 阅读 · 0 评论