文章目录
一、大数据概念
大数据就是巨量的数据。大数据的计量单位已经超过TB级别发展到PB、EB、ZB、YB甚至BB级别。
大数据是指在一定时间内无法使用传统数据库软件工具采集、存储、管理和分析其内容的数据集合。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对于这些含有意义的数据进行专业化处理。
二、大数据5大特点
大数据具有5各方面的特点,规模性(Volume)、多样性(Variety)、高速性(Velocity)、价值性(Value)、真实性(Veracity)。
2.1 规模性
数据规模大
2.2 多样性
大数据可以分为三类:
1.结构化数据,指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每行数据的属性是相同的。
2.非结构化数据,指的是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二位逻辑表来表现得数据。
3.半结构化数据,是结构化数据的一种,不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此&#x