大数据学习日志
--Satoshi--
学生一个
展开
-
--Satoshi--大数据的学习日志(2017.07.17)
1.结构化与非结构化数据的概念 结构化数据:简单的说结构化数据就是数据库。他严格遵循数据格式与长度规范,主要通过关系型数据进行管理。 非结构化数据:他是数据结构不规则或不完整没有预定义的模型,不方便用数据库二维逻辑表来表现的数据。 2.大数据是什么,有什么特点? 大数据:指在一定时间内无法通过常规的软件工具进行捕捉、管理和处理的数据合集,是需要新的处理模式才能具有更强的决策力原创 2017-07-17 18:35:05 · 242 阅读 · 0 评论 -
--Satoshi--大数据学习日志(2017.07.19)
master/slave主从结构: HDFS是一个 master/slave的架构。HDFS只有一个NameNode,即master。master负责管理文件系统命名空间和client对文件的访问。此外,HDFS有很多DataNode,通常一个机器节点一个DataNode,管理这个节点上的存储。HDFS对外提供一个文件系统名字空间允许用户把数据存为文件的格式。 文件拆分成若干个block,这原创 2017-07-20 08:37:30 · 250 阅读 · 0 评论