一、大数据简介
- 在著名未来学家阿尔文·托夫勒《第三次浪潮》一书中,大数据被热情的称为“第三次浪潮的华彩乐章”。而第一次第二次浪潮指的分别是农业时代和工业时代。
- 在百度百科中对大数据的词条有以下解释:
对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
- 大数据是当前IT产业的具有颠覆性的技术变革,它是我们分析事物的优秀途径。
二、大数据的主要来源
- 网络信息系统:如各种社交应用,社会媒体,比如微博,淘宝等等。你在这些APP软件上的使用痕迹,你账户的信息。都可以是大数据的来源。
- 信息管理系统:包括办公自动化系统、业务管理系统等等。
- 物联网系统:在百度词条对物联网做出了如下解释
物联网(英语:Internet of Things,缩写IoT)是互联网、传统电信网等信息承载体,让所有能行使独立功能的普通物体实现互联互通的网络。物