数据
人对客观事物的观察在大脑中产生的一种记忆,如视频、图像、声音、文字等。
数据的意义
通过对一定量的数据的分析,所得出的规律可以指导实际活动,从而使实际活动更加容易。一般数据越多,规律越多,越准确。
大数据
- 计算机的出现,使对于数据的计算与存储不在局限于人脑和之前实体的记录方式(纸笔等),计算机可以存储更大量的数据。
- 大数据的出现,与1类似,对于更更大量的数据,我们需要更快更准确的计算和更大的存储容量。
- 定义: 当前的技术无法进行处理和分析的数据量。
- 关键词: 服务器、服务器集群、分布式
- 重点理论和技术: 谷歌三篇论文、hadoop(HDFS、MapReduce)
数据仓库的概念
- 数仓是一个过程,不是一个项目;
- 数仓是一个环境,不是一个产品。
数仓的特点
- 数仓是面向一个目的性工作的
- 数仓是由多种数据集合而成的
- 数仓中的数据是不断变化的
- 数仓中的数据一般是不可更改的
数据库与数仓的区别
- OLTP(联机事务处理:增删改查)VS OLAP(联机分析处理:各种方式查询&