sql简单梳理

PowerSnow ZZ

已于 2024-09-27 11:11:26 修改

阅读量636

点赞数 14

文章标签： sql 数据库

于 2024-09-26 22:05:25 首次发布

本文链接：https://blog.csdn.net/m0_69556081/article/details/142577425

版权

1.DDL语句(数据定义语言)

2.DML语句(数据操纵语言)

3.DQL语句(数据查询语言)(oracle数据库的DQL)

4.SQL优化

5.其他(伪列,分区)

1.DDL语句(数据定义语言)

1)create用于创建新的数据库对象,如表,视图,索引等

2)alter用于修改现有数据库对象的结构,比如添加，删除或修改列

3)drop用于删除现有的数据库对象,如表，视图或索引

4)truncate用于快速删除表中所有记录，但是不删除表本身，且通常不能恢复

5)rename用于重命名现有的数据库对象

6)comment用于为数据库对象添加注释或者描述

2.DML语句(数据操纵语言)

1)insert用于向表中插入新记录

2)update用于更新已存在的记录

3)delete用于删除表中的记录

4)merge(upsert)用于在单个操作中执行插入或更新，具体取决于记录是否存在，存在更新，不存在插入

3.DQL语句(数据查询语言)(oracle数据库的DQL)

1)select用于从一个或多个表中检索数据

使用where字句查询特定条件

使用order by 对结果进行排序

使用rownum限制返回的行数(rownum是在查询后处理的)

使用聚合函数来获取统计信息,如计数,平均值等

使用group by 对数据进行分组,并结合聚合函数使用

having与group by一起使用，过滤分组后的结果

2)分析函数的种类与使用(我常用的)

排名类:(必须在over里面写order by)

row_number() 连续不重复总共5个， 12345

rank() 重复不连续总共5个， 12245

dense_rank() 重复且连续总共5个， 12234

ntile(n) 将结果集分成n桶，并且为每一行分配桶编号

聚合类:

sum(),avg(),max(),min(),count()

偏移类:(必须在over里面写order by)

语法举例:LAG(column_name, offset, default_value) OVER (PARTITION BY partition_expression ORDER BY order_expression)

column_name: 要获取的列。
offset: 偏移量，表示要向前查看多少行（默认为1）。
default_value: 如果没有足够的前行，可以返回的默认值

lead() 向上偏移

lag() 向下偏移

first_value() 返回窗口内的第一个值

last_value() 返回窗口内的最后一个值

3）各个关键字后面可以放什么东西

select后面:列名,计算表达式,聚合函数,distinct,子查询,case语句,窗口函数

from后面:表名,多表join连接,子查询,视图,临时表

where后面:列名与运算符,逻辑运算符,in,exists,between,like,is null/is not null,case when语句,函数

group by后面:分组字段，函数计算字段

4)多表查询-join

inner join 内连接两表中的数据完全匹配才会返回

left join 左外连接左表全有，至少左表条数的数据返回

right join 右外连接右表全有，至少右表条数的数据返回

full join全外连接两表的数据全有，总条数等于，左表条数+(右表条数-匹配条数)

cross join 交叉连接笛卡尔积 ,两表数据条数相乘条数的返回结果

5)谓词下推

谓词下推(predicate pushdown)是一种优化技术,它允许查询中的过滤条件(谓词)在数据检索的早起阶段就被应用,以减少需要处理的数据量，先筛选再关联,将这些谓词'推到'更接近数据源的层面，可以提高查询性能.

查看执行计划查看谓词下推是否生效

6)union和union all及join改写union all

union会对数据进行排序然后进行去重,union all直接向上粘

将join语句改写成为union all,因为多表join操作会非常耗费性能，因此常常需要把Join改写为union all的操作，先从简单的来举例，两张表根据关联字段进行join操作，然后select相关字段

进行union all操作之前先确定关联字段和select要查询的字段，因为一般一张表不一定有另外一张表的字段，这种情况下就是默认空值处理,然后把两张表要select的字段以及关联字段进行Union all的操作，这时候你会发现，如果是一对一的关系的话，会出现关联字段有两个重复的，这时候聚合函数就起作用了，根据关联字段进行聚合然后，对select后面的字段取最大值把空值去掉.

上面说的是表关系是1:1的情况，那么1:n这种情况怎么办呢?1:n根据关联字段进行union all之后会出现多个相同关联字段的情况，但是他们不是一一匹配的关系，所以不能直接进行聚合操作。

这种时候可以使用分析函数的max，求最大值，然后把空值给筛选掉

如果n:m的，目前我不太清楚，不过建议可以join成1：n或者1:1然后进行union all ...