1 数据库概述
1.1 什么是数据库
数据库(Database)是按照数据结构来组织、存储和管理数据的仓库
1.2 为什么使用数据库
企业数据存储面临诸多问题
- 数据量大
- 大量数据的检索和访问
- 保证数据信息的一致和完整
- 数据共享和安全
1.3 数据库分类
1.3.1 关系型数据库
由行和列组合而成的二维表结构的数据,库中是以表的形式存储的结构化数据集结构化数据集。
- Oracle:运行稳定、可移植性高、功能齐全、性能超群,适用于大型企业。
- DB2:速度快、可靠性好、适用于海量数据、恢复性极强,适用于大中型企业。
- MySQL:开源、体积小、速度快,适用于中小型企业。
- SQL server :全面高效、界面友好易操作,但是不跨平台,适用于中小型企业。
1.3.2 非关系型数据库
库中是以键值对形式存储的非结构化数据集,例如用户的聊天记录、拍摄的图片、录制的视频等等。
- mongoDB
- redis
- HBase
1.4 表结构
1.4.1 什么是表结构
由固定列和任意行构成的二维表结构的数据集。
表中的列称为字段,表中的行称为记录
1.4.2 表结构数据
数据库结构的数据(多行多列),它是数据分析工具中最基本的存储结构
1.4.3 表结构数据特征
- 表中的第一行是标题行,也称为字段名。
- 表中第二行开始到最后一行的内容称为记录。
- 字段名来定位不同的字段,每个字段必须有字段名,且同一个表中的字段名不能重复。每一个字段只能有一种数据类型
- 表中所有字段的记录数一致(记录行数要相同)。
- 记录中可以存在空值、缺失值
1.4.5 表结构数据的优势
- 几乎所有数据分析工具都支持表结构的存储格式,可以非常轻松地关联并整合多种不同数据源的数据。
- 以字段为基本计算单位,运算效率要高于以单元格为计算单位的表格数据,可以对海量数据进行批量计算。
- 可以在不同表间建立关联关系,将不同维度数据表整合为一个完整的多维数据集,创建统一的数据分析平台,解决信息孤岛问题。
- 通过搭建多维数据平台,在不同维度下对度量进行汇总观测
表由字段(列)组成,字段由 字段名 + 记录(行) 组成,也就是字段的集合为表,表的集合为数据库
2 mysql简介
2.1 数据库、数据库管理系统和SQL之间的关系
- 数据库是长期存储在计算机内、有组织的、统一管理的相关数据的集合。
- 数据库管理系统是用于管理数据库的软件,它对数据库进行统一的管理和控制,以保证数据库的安全性和完整性。
- SQL是一种结构化查询语言(Structure Query Language),它是国际标准化组织(ISO)采纳的标准数据库语言。
2.2 MySQL客户端常用工具
- 命令行(cmd)
- 图形化工具(IDE)
MySQLworkbench
Navicat
SQLyog
mysql官网:https://www.mysql.com/
3 SQL语言
3.1 SQL书写要求
- SQL语句可以单行或多行书写,用分号结尾。
- SQL关键字用空格分隔,也可以用缩进来增强语句的可读性。
- SQL不区分大小写。
- 用#或–单行注释,用/* */多行注释。
- 注释语句不可执行。
3.2 SQL分类
3.2.1 数据定义语言DDL
用于创建、删除、修改、查看数据库中的各种对象(表、视图、索引等),常用命令有CREATE,ALTER,DROP
3.2.2 数据操作语言DML
用来操作数据库表中的记录,常用命令有INSERT,UPDATE,DELETE
3.2.3 数据查询语言DQL
用来查询数据库表中的记录,基本结构:SELECT 字段名 FROM 表或视图名 WHERE 查询条件
3.2.4 数据控制语言DCL
用来定义数据库访问权限和安全级别,常用命令:GRANT,REVOKE