目录
一、数据库与数据仓库的区别
数据库:数据库是面向交易的处理系统(业务系统),它是针对具体业务在数据库联机的日常操作,通常对记录进行查询、修改。用户较为关心操作的响应时间、数据的安全性、完整性和并发支持的用户数等问题。传统的数据库系统作为数据管理的主要手段,主要用于操作型处理,也被称为联机事务处理 OLTP(On-Line Transaction Processing)。
数据仓库::数据仓库一般针对某些主题的历史数据进行分析,支持管理决策,又被称为联机分析处理 OLAP(On-Line Analytical Processing)。
数据仓库VS数据库
- 数据库是面向事务的设计,数据仓库是面向主题设计的。
- 数据库一般存储业务数据,数据仓库存储的一般是历史数据。
- 数据库设计是尽量避免冗余,一般针对某一业务应用进行设计,比如一张简单的User表,记录用户名、密码等简单数据即可,符合业务应用,但是不符合分析。数据仓库在设计是有意引入冗余,依照分析需求,分析维度、分析指标进行设计。
- 数据库是为捕获数据而设计,数据仓库是为分析数据而设计。
二、数据仓库
1.数据仓库诞生的原因
- 历史数据积存:历史数据使用频率过低,堆积在业务数据库中,会导致查询性能下降
- 企业数据分析需要:各个部门自己建立独立的数据抽取系统,导致数据不一致,资源 浪费严重,数据库权限也会存在风险
2.数据仓库的基本概念
数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库顾名思义,是一个很大的数据存储集合,出于企业的分析性报告和决策支持目的而创建,对多样的业务数据进行筛选与整合。它为企业提供一定的BI(商业智能)能力,指导业务流程改进、监视时间、成本、质量以及控制。
3.数据仓库的主要特征
1)面向主题的(Subject-Oriented)
不同于传统数据库对应于某一个或多个项目,数据仓库根据使用者实际需求,将不同数据源 的数据在一个较高的抽象层次上做整合,所有数据都围绕某一主题来组织。
2)集成性(Integrated)
数据仓库中存储的数据是来源于多个数据源的集成,原始数据来自不同的数据源,存储方式各不相同。要整合成为最终的数据集合,需要从数据源经过一系列抽取、清洗、转换的过程。
3)稳定性(Non-Volatile)
数据仓库中保存的数据是一系列历史快照,不允许被修改。用户只能通过分析工具进行查询和分析。这里说明一点,数据仓库基本上是不许允许用户进行修改,删除操作的。大多数的场景是用来查询分析数据。
4)时变性(Time-Variant)
数据仓库会定期接收新的集成数据,反应出最新的数据变化。这和稳定特点并不矛盾。
4.数据仓库分层架构
按照数据流入流出的过程,数据仓库架构可分为三层——源数据、数据仓库、数据应用。
三、数据库的操作
1、创建一个指定名字的数据库
create database db_1;
2、创建一个指定字符集的数据库
create database db_2 charset utf8MB4;
3、创建一个指定校对集的数据库
create database db_3 charset utf8MB4 collate utf8mb4_general_ci;
4、显示所有数据库
show databases;
5、使用数据库
使用数据库:指在进行具体SQL指令之前,让系统知道操作针对的是哪个数据库
- 数据库的操作通常是针对数据表或者数据
- 通过使用数据库可以让后续指令默认针对具体数据库环境
- 使用数据库语法:
use 数据库名字;
use db_1;
6、删除数据库
将当前已有数据库删除
- 删除数据库会删除数据库内所有的表和数据
- 删除数据库操作要慎重(删前备份)
- 删除数据库后,对应的存储文件夹就会消失
- 删除语法
drop database 数据库名字;
drop database db_1;
四、创建数据表
1、创建简单数据表(指定数据库创建数据表)
create table db_2.t_1(
name varchar(50)
);
待补充……