首先,回顾一下数据分析的三大作用:
- 现状分析
告诉我们过去发生了什么 - 原因分析
告诉我们为什么发生 - 预测分析
告诉我们将来会发生什么
为什么不继续采用Excel作为数据分析的工具呢?
因为Excel对数据行和列数都有限制。现在数据动不动就是几百万条,Excel已经满足不了数据处理与分析的需求了!
一、数据库的那些事儿
数据库(Database)是按照数据结构来组织、存储和管理数据的仓库。它利用数据库中的各种对象,记录、处理和分析各种数据。
一个通用数据库具有以下几项基本功能:
- 向数据中添加新数据记录,例如增加用户注册信息;
- 编辑数据库中的现有数据,例如修改某个用户信息;
- 删除数据库中的信息记录,例如删除失去时效性的数据,以释放存储空间;
- 以不同方式组织和查看数据,例如对数据进行查询、处理和分析。
总之,数据库可以实现对数据的增删改查。
二、Access数据库
Access数据库是Microsoft Office办公软件的一个重要组成部分,是一种关系型数据库管理系统软件,数据处理给你比Excel更胜一筹。
在Access中,数据库窗口包含“表”、“查询”、“窗体”、“报表”、“宏”等对象。
- “表”用来存储数据;
- “查询”用来查找数据;
- “窗体”、“报表”用来获取数据;
- “宏”则用来实现数据的自动化操作。
Access数据库作为Microsoft Office的一员,还可以与Excel、Word、PowerPoint、Outlook等软件进行数据的交互与共享。
Access进行数据处理于分析,主要用到的对象是:表和查询。
1. 表
表是数据库最基本的组成单位。建立和规划数据库,首先要做的是建立各种数据表。数据表是数据库中存储数据的唯一单位,数据库将各种信息分门别类地存放在各种数据表中,例如用户信息表、订单表、采购表等。
2. 查询
查询是数据库中应用最多的对象之一,可执行很多不同的姑娘,最常用的功能是根据指定条件从表中检索数据。
查询和表的区别在于,查询中的所有数据都不是真正单独存在的。查询实际上是一个固定的筛选,它根据指定条件将表中的数据筛选出来,并以表的形式返回筛选结果。
3. 为什么用Access数据库?
Access数据库于Oracel等其他关系型数据库相比具有以下两大优势:
- 操作界面友好,易操作
Access与Excel、PowerPoint、Word都是微软Office产品,只要熟悉其中的任意一款软件,即使没有数据库经验,对Access也能快速上手。Access还可以与Office其他软件集成,实现无缝链接。 - Access查询处理可以直接生成相应的SQL语句
通过Access查询想到设置好需要的表关联及查询条件,单击“SQL视图”,即可获取相应的SQL语句,无须重新编写。在此基础上,还可以进行简单的调整、优化,即可转化为所需的SQL语句,方便快捷。
当然,Access是小型数据库,于Oracel等其他关系型数据库相比存在以下的不足:
- 数据过大时(一般Access数据库文件百兆以上),其性能会变差。
- 记录数过多时(