1.结构化与非结构化数据的概念
结构化数据:简单的说结构化数据就是数据库。他严格遵循数据格式与长度规范,主要通过关系型数据进行管理。
非结构化数据:他是数据结构不规则或不完整没有预定义的模型,不方便用数据库二维逻辑表来表现的数据。
2.大数据是什么,有什么特点?
大数据:指在一定时间内无法通过常规的软件工具进行捕捉、管理和处理的数据合集,是需要新的处理模式才能具有更强的决策力,洞察发现力和流程优化力的海量、多优化和高增长力的信息资产。
特点:(1)容量:数据大小决定所考虑的数据的价值和潜在的信息
(2)种类:数据类型的多样性
(3)速度:只获取素的速度
(4)可变性:妨碍了处理和有效地数据处理的过程
(5)真实性:数据的质量
(6)复杂性:数据巨大,来源渠道多
(7)价值:合理运用大数据,以低成本创造高价值
3.数据仓库
数据仓库:是为所有级别的决策过程,提供所有类型数据支持的战略合集,他是单个数据存储,处于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供知道业务流程改进、监事时间、成本、质量以及控制。
4.CAP理论
CAP理论:指在一个系统中,一致性,可用性,分区容错性三者不可兼容