数据分析系列-SQL

数据分析系列-SQL入门教程

1 SQL语法规则

1.1 概念篇

databases:数据库
tables   :表
columns  :列/字段/属性
rows     :行/记录

1.2 SQL语句执行顺序

1. FROM 和 JOINs
FROMJOIN会第一个执行,确定一个整体的数据范围. 如果要JOIN不同表,可能会生成一个临时Table来用于 下面的过程。总之第一步可以简单理解为确定一个数据源表(含临时表)

2. WHERE
我们确定了数据来源 WHERE 语句就将在这个数据源中按要求进行数据筛选,并丢弃不符合要求的数据行,所有的筛选col属性 只能来自FROM圈定的表. AS别名还不能在这个阶段使用,因为可能别名是一个还没执行的表达式

3. GROUP BY
如果你用了 GROUP BY 分组,那GROUP BY 将对之前的数据进行分组,统计等,并将是结果集缩小为分组数.这意味着 其他的数据在分组后丢弃.

4. HAVING
如果你用了 GROUP BY 分组, HAVING 会在分组完成后对结果集再次筛选。AS别名也不能在这个阶段使用.

5. SELECT
确定结果之后,SELECT用来对结果col简单筛选或计算,决定输出什么数据.

6. DISTINCT
如果数据行有重复DISTINCT 将负责排重.

7. ORDER BY
在结果集确定的情况下,ORDER BY 对结果做排序。因为SELECT中的表达式已经执行完了。此时可以用AS别名.

8. LIMIT / OFFSET
最后 LIMITOFFSET 从排序的结果中截取部分数据.

1.3 筛选数据:where

1.3.1 筛选数字

当查找的列是数字:

OperatorConditionSQL Example解释
=,!=,<,<=,>,>=Standard numerical operatorscol != 4等于,大于,小于
BETWEEN…AND…筛选字段的值在两个值之间,包含这两个值col between 1.5 and 10.5在1.5~10.5之间包含1.5和10.5
not between…and…筛选字段的值不在两个值之间,不包含这两个值col not between 1.5 and 10.5小于1.5 大于10.5的值
in(…)筛选字段的值在一个集合内col in (2,4,6)筛选col的值在集合(2,4,6)
not in(…)筛选字段的值不在集合内col not in (2,4,6)筛选col的值不在集合(2,4,6)
1.3.2 筛选文本

当筛选的列是文本

OperatorConditionSQL Example解释
=,!=,<>等于,不等于col = “abc” col !=“abcd” col<>“abc”等于,不等于
like not like等于 不等于col like ”abc“ col not like ”abcd“字符串相等常用like与not like
%通配符 与like/not like配合使用col like %abc%模糊匹配 任意字符
_通配符 与like/not like配合使用col like an_模糊匹配单个字符
in/not in与筛选数字相同col not in (”A“,”B“,”C“)筛选col的值是否在集合内

1.4 筛选后排序-rows

通过where匹配到想要的数据后,需要对数据以行为单位,进行排序或筛选

select * from table1 where col1 > 1 order by col1 desc limit 2 offset 2
OperatorConditionSQL Example解释
order byorder by + columnorder by name asc/desc按照name列升序/降序排序
asc升序order by name asc升序(默认)
desc降序order by name desc降序
limit offset筛选limit 2 offset 2从第二条记录开始往下取出两条记录
order by多列排序order by name desc,age asc按照name列升序排序,age列降序排列

1.5 连表 - join

当查找的数据在多张表中,需要根据id进行关联

select * from table1 left join table2 on table1.id = table2.id where col > 1
OperatorConditionSQL Example解释
JOIN…ON…select * from table1 as t1 join table name as t2 on t1.id = t2.id按ID连成一个表
inner join … on…只保留id相等的行
left join…on…只保留左表所有行
right join…on…只保留右表所有行
is null / is not nullcol is nullcol是不是null返回true/false

1.6 算式

当需要对select的col或where条件的col经过一定计算后才能使用

select *,col*2 from table where col/2 > 4
OperatorConditionSQL Example解释
+,-,*,/,%加,减,乘,除,取余
substrsubstr(col,0,4)字符串截取
As取别名

列经过算式计算后索引会失效,降低查询效率,慎用

1.7 统计

对查找的rows需要按列进行分组统计

select coount(*) , avg(col), col from table where col > 1 group by col
OperatorConditionSQL Example解释
count(1),count(*),count(col name)计数count(col)count(*) 扫描所有列,count(1) 忽略为null的行,count(column name) 按列计数
min()获取最小值min(column)单列最小
max()获取最大值max(column)单列最大
avg()获取平均值avg(column)单列平均
sum()获取列的和sum(column)单列求和
group by按列名分组group by column按列分组
having分组后按组筛选group by column having col > 1分组后条件

1.8 子表

一次select得到的rows作为下一次select的临时表才能得到最终结果

select * from (select * from table where col > 1) as tmp where col < 1
OperatorConditionSQL Example解释
(select -) as tempselect结果做子表
in (select -)select结果做条件

2 未完待续

原创文章,如果需要转载请注明出处,谢谢

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

kobe_OKOK_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值