1. 大数据的定义
对于“大数据”(Big data)研究机构Gartner给出了定义,“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
引用自 big大鸟 的博客
2.大数据的主要来源
大数据的来源非常广泛,如信息管理系统、网络信息系统、物联网系统、科学实验系统等,其数据类型包括结构化数据、半结构化数据和非结构化数据。
(1)信息管理系统:企业内部使用的信息系统,包括办公自动化系统、业务管理系统等。信息管理系统主要通过用户输入和系统二次加工的方式产生数据,其生产的大数据大多为结构化数据,通常存储在数据库中。
(2)网络信息系统:基于网络运行的信息系统即网络信息系统是大数据产生的重要方式。如电子商务系统、社交网络、社会媒体等。网络信息系统产生的大数据多数为半结构化数据或非结构化数据。
(3)物联网系统:物联网是新一代信息技术,其核心和基础仍然是互联网,是互联网基础上的延伸和扩展的网络,其用户端延伸和扩展到了