什么是大数据
大数据的定义
麦肯锡全球研究所给出的定义:
一种规模大到获取、存储、管理、分析方面大大超出传统的数据库软件工具能力范围的数据。
数据多到爆表(PB级别)
(G、T、P、E、Z、Y、B、N、D)
大数据与的特点:(4V)
-
Volume(大量)
PB级别 -
Velocity(高速)
获取数据速度和分析数据的速度 -
Variety(多样)
来源复杂
Value(价值)
高价值
数据结构
- 结构化数据: 简单来说就是数据库 是由二维表结构来逻辑表达和实现的数据
- 非结构化数据: 数据结构不规则或不完整 没有预定义的数据模型
身边的大数据
-
电信数据
通话数据 短信数据 手机浏览数据
-
银行数据
-
微信聊天数据
大数据可以做什么
-
数据挖掘
用户画像 知识图谱
-
人工智能
Google的‘阿尔法狗’ IBM的“沃森” 阿里巴巴的“ET” 百度的“无人驾驶汽车”
-
区块链
数字货币 物联网