大数据概念:
大数据的定义是
以超出常规手段收获的大量数据集,
特点是具有
多样性,准确性强,增长速度快,价值密度低,体量大。
大数据的结构类型分三种,一种是结构化数据类型,一种是半结构化数据类型,另一种是非结构化数据类型。
其中,半结构化数据类型两种常用类型是
XML文档和
JSON,还有
HTML,
邮件,
报表,
结构化数据类型有
关系数据表,
非结构化数据类型有
WEB日志,
实时多媒体,
社交网络数据,
文档类型数据。
大数据技术: 数据采集
数据的预处理
数据的存储
数据的分析和挖掘
大数据应用