SQL训练营学习笔记

  • 学习知识点概要
  • 学习内容
  • 学习问题与解答
  • 学习思考与总结

Task01:初识数据库与SQL

目录
一、初识数据库
1.1 DBMS的种类
1.2 RDBMS的常见系统结构
1.3 数据库安装
1.3.1 阿里云MySQL服务器使用介绍
1.3.2 本地MySQL环境搭建方法介绍
二、初识 SQL
2.1 概念介绍
2.2 SQL的基本书写规则
2.3 数据库的创建( CREATE DATABASE 语句)
2.4 表的创建( CREATE TABLE 语句)
2.5 命名规则
2.6 数据类型的指定
2.7 约束的设置
2.8 表的删除和更新
2.9 向 product 表中插入数据
三、练习题
3.1
3.2
3.3
3.4

Task02:SQL基础查询与排序

一、SELECT语句基础
1.1 从表中选取数据
1.2从表中选取符合条件的数据
1.3 相关法则
二、算术运算符和比较运算符
2.1 算术运算符
2.2 比较运算符
2.3 常用法则
三、逻辑运算符
3.1 NOT运算符
3.2 AND运算符和OR运算符
3.3 通过括号优先处理
3.4 真值表
3.5 含有NULL时的真值
练习题-第一部分
练习题1
练习题2
练习题3
练习题4
四、对表进行聚合查询
4.1 聚合函数
4.2 使用聚合函数删除重复值
4.3 常用法则
五、对表进行分组
5.1 GROUP BY语句
5.2 聚合键中包含NULL时
5.3 GROUP BY书写位置
5.4 在WHERE子句中使用GROUP BY
5.5 常见错误
六、为聚合结果指定条件
6.1 用HAVING得到特定分组
6.2 HAVING特点
七、对查询结果进行排序
7.1 ORDER BY
7.2 ORDER BY中列名可使用别名
练习题-第二部分
练习题5
练习题6
练习题7

Task03:复杂查询方法-视图、子查询、函数等
3.1 视图
3.1.1 什么是视图
3.1.2 视图与表有什么区别
3.1.3 为什么会存在视图
3.1.4 如何创建视图
3.1.5 如何修改视图结构
3.1.6 如何更新视图内容
3.1.7 如何删除视图
3.2 子查询
3.2.1 什么是子查询
3.2.2 子查询和视图的关系
3.2.3 嵌套子查询
3.2.4 标量子查询
3.2.5 标量子查询有什么用
3.2.6 关联子查询
小结
练习题-第一部分
3.1
3.2
3.3
3.4
3.3 各种各样的函数
3.3.1 算数函数
3.3.2 字符串函数
3.3.3 日期函数
3.3.4 转换函数
3.4 谓词
3.4.1 什么是谓词
3.4.2 LIKE谓词 – 用于字符串的部分一致查询
3.4.3 BETWEEN谓词 – 用于范围查询
3.4.4 IS NULL、 IS NOT NULL – 用于判断是否为NULL
3.4.5 IN谓词 – OR的简便用法
3.4.6 使用子查询作为IN谓词的参数
3.4.7 EXIST 谓词
3.5 CASE 表达式
3.5.1 什么是 CASE 表达式?
3.5.2 CASE表达式的使用方法
练习题-第二部分
3.5
3.6
3.7

Task04:集合运算-表的加减法和join等-天池龙珠计划SQL训练营

正在上传…重新上传取消​天池小美

2021-09-09 15:34:39

21

2733

1

文章

4.1表的加减法
4.1.1 什么是集合运算
4.1.2 表的加法–UNION
4.1.2.1 UNION
4.1.2.2UNION 与 OR 谓词
4.1.2.3 包含重复行的集合运算 UNION ALL
4.1.2.4[扩展阅读]bag 模型与 set 模型
4.1.2.5隐式类型转换
4.1.3 MySQL 8.0 不支持交运算INTERSECT
4.1.3.1[扩展阅读]bag 的交运算
4.1.4 差集,补集与表的减法
4.1.4.1 MySQL 8.0 还不支持 EXCEPT 运算
4.1.4.2 EXCEPT 与 NOT 谓词
4.1.4.3EXCEPT ALL 与bag 的差
4.1.4.4INTERSECT 与 AND 谓词
4.1.5对称差
4.1.5.1借助并集和差集迂回实现交集运算 INTERSECT
4.2连结(JOIN)
4.2.1 内连结(INNER JOIN)
4.2.1.1 使用内连结从两个表获取信息
4.2.1.2 结合 WHERE 子句使用内连结
4.2.1.3结合 GROUP BY 子句使用内连结
4.2.1.4自连结(SELF JOIN)
4.2.1.5内连结与关联子查询
4.2.1.6自然连结(NATURAL JOIN)
4.2.1.7使用连结求交集
4.2.2 外连结(OUTER JOIN)
4.2.2.1 左连结与右连接
4.2.2.2 使用左连结从两个表获取信息
4.2.2.3结合 WHERE 子句使用左连结
4.2.2.4在 MySQL 中实现全外连结
4.2.3多表连结
4.2.3.1 多表进行内连结
4.2.3.2多表进行外连结
4.2.4ON 子句进阶–非等值连结
4.2.4.1非等值自左连结(SELF JOIN)
4.2.5 交叉连结—— CROSS JOIN(笛卡尔积)
4.2.5.1[扩展阅读]连结与笛卡儿积的关系
4.2.6 连结的特定语法和过时语法
练习题
4.1
4.2
4.3
4.4
4.5

Task05:窗口函数等--天池龙珠计划SQL训练营

正在上传…重新上传取消​天池小美

2021-08-18 23:23:39

14

1497

1

文章

5.1窗口函数
5.1.1窗口函数概念及基本的使用方法
5.2窗口函数种类
5.2.1专用窗口函数
5.2.2聚合函数在窗口函数上的使用
5.3窗口函数的的应用 - 计算移动平均
5.3.1窗口函数适用范围和注意事项
5.4GROUPING运算符
5.4.1ROLLUP - 计算合计及小计
练习题
5.1
5.2
5.3

Task06:综合练习题-10道经典题目-天池龙珠计划SQL训练营

正在上传…重新上传取消​天池小美

2021-11-18 15:15:31

31

1608

4

文章

如果你还没有学习过SQL训练营的前几个章节知识,

Task 1 SQL基础:初识数据库与SQL-安装与基本介绍等
Task 2 SQL基础:查询与排序-select、运算符、聚合分组查询等
Task 3 SQL进阶:复杂查询方法-视图、子查询、函数等
Task 4 SQL进阶: 集合运算-表的加减法和join等
Task 5 SQL进阶:SQL高级处理-窗口函数等

可以点击SQL训练营页面地址进入学习:AI训练营SQL-阿里云天池
天池龙珠计划训练营地址:AI训练营-阿里云天池

下载相关创建表格和插入数据脚本

这里为了方便大家,数据脚本已经给大家准备好啦。
点击下方链接直接下载
创建数据表脚本:http://tianchi-media.oss-cn-beijing.aliyuncs.com/dragonball/SQL/create_table.sql
插入数据脚本:http://tianchi-media.oss-cn-beijing.aliyuncs.com/dragonball/SQL/data.zip

大家下载好脚本后,先在MySQL环境中运行create_table.sql脚本,创建数据表,然后解压下载好的data.zip,解压后目录如下:

8-10ccf_offline_stage1_train.sql
6-winequality-white.sql
5-8-10ccf_online_stage1_train.sql
4-macro industry.sql
3-ccf_offline_stage1_test_revised.sql
2-winequality-red.sql
1-9income statement.sql
1-9company operating.sql
1-7market data.sql

脚本文件名前面的序号表示用到该数据集的题目序号,例如1-7market data.sql表示第1题和第7题用到了该数据集。
同样的,这里给大家的也是sql脚本,里面是插入数据的语句,大家只需打开后在MySQL环境中运行即可将数据导入到数据表中。

练习题1:

数据来源:数据集-阿里云天池

请使用A股上市公司季度营收预测数据集《Income Statement.xls》和《Company Operating.xlsx》和《Market Data.xlsx》,以Market Data为主表,将三张表中的TICKER_SYMBOL为600383和600048的信息合并在一起。只需要显示以下字段。

表名字段名
Income StatementTICKER_SYMBOL
Income StatementEND_DATE
Income StatementT_REVENUE
Income StatementT_COGS
Income StatementN_INCOME
Market DataTICKER_SYMBOL
Market DataEND_DATE_
Market DataCLOSE_PRICE
Company OperatingTICKER_SYMBOL
Company OperatingINDIC_NAME_EN
Company OperatingEND_DATE
Company OperatingVALUE

练习题2:

数据来源:数据集-阿里云天池

请使用 Wine Quality Data 数据集《winequality-red.csv》,找出 pH=3.03的所有红葡萄酒,然后,对其 citric acid 进行中式排名(相同排名的下一个名次应该是下一个连续的整数值。换句话说,名次之间不应该有“间隔”)

练习题3:

数据来源:天池新人实战赛o2o优惠券使用预测赛题与数据-天池大赛-阿里云天池

使用Coupon Usage Data for O2O中的数据集《ccf_offline_stage1_test_revised.csv》,试分别找出在2016年7月期间,发放优惠券总金额最多和发放优惠券张数最多的商家。

这里只考虑满减的金额,不考虑打几折的优惠券。

练习题4:

数据来源:数据集-阿里云天池

请使用A股上市公司季度营收预测中的数据集《Macro&Industry.xlsx》中的sheet-INDIC_DATA,请计算全社会用电量:第一产业:当月值在2015年用电最高峰是发生在哪月?并且相比去年同期增长/减少了多少个百分比?

练习题5:

数据来源:天池新人实战赛o2o优惠券使用预测赛题与数据-天池大赛-阿里云天池

使用Coupon Usage Data for O2O中的数据集《ccf_online_stage1_train.csv》,试统计在2016年6月期间,线上总体优惠券弃用率为多少?并找出优惠券弃用率最高的商家。

弃用率 = 被领券但未使用的优惠券张数 / 总的被领取优惠券张数

练习题6:

数据来源:数据集-阿里云天池

请使用 Wine Quality Data 数据集《winequality-white.csv》,找出 pH=3.63的所有白葡萄酒,然后,对其 residual sugar 量进行英式排名(非连续的排名)

练习题7:

数据来源:数据集-阿里云天池

请使用A股上市公司季度营收预测中的数据集《Market Data.xlsx》中的sheet-DATA,

计算截止到2018年底,市值最大的三个行业是哪些?以及这三个行业里市值最大的三个公司是哪些?(每个行业找出前三大的公司,即一共要找出9个)

练习题8:

数据来源:天池新人实战赛o2o优惠券使用预测赛题与数据-天池大赛-阿里云天池

使用Coupon Usage Data for O2O中的数据集《ccf_online_stage1_train.csv》和《ccf_offline_stage1_train.csv》,试找出在2016年6月期间,线上线下累计优惠券使用次数最多的顾客。

练习题9:

数据来源:数据集-阿里云天池

请使用A股上市公司季度营收预测数据集《Income Statement.xls》中的sheet-General Business和《Company Operating.xlsx》中的sheet-EN。

找出在数据集所有年份中,按季度统计,白云机场旅客吞吐量最高的那一季度对应的净利润是多少?(注意,是单季度对应的净利润,非累计净利润。)

练习题10:

数据来源:天池新人实战赛o2o优惠券使用预测赛题与数据-天池大赛-阿里云天池

使用Coupon Usage Data for O2O中的数据集《ccf_online_stage1_train.csv》和《ccf_offline_stage1_train.csv》,试找出在2016年6月期间,线上线下累计被使用优惠券满减最多的前3名商家。

比如商家A,消费者A在其中使用了一张200减50的,消费者B使用了一张30减1的,那么商家A累计被使用优惠券满减51元。

本教程相关练习题答案可以在天池官方公众号:天池大数据科研平台 回复:SQL训练营 获取。

作者:Datawhale成员:王复振、杨煜、闫钟峰、杨梦迪、苏鹏

如果你对本次学习有任何问题,欢迎加入阿里云天池龙珠计划SQL训练营进行学习交流。

学习内容

2.1 概念介绍

数据库中存储的表结构类似于excel中的行和列,在数据库中,行称为记录,它相当于一条记录,列称为字段,它代表了表中存储的数据项目

根据对 RDBMS 赋予的指令种类的不同,SQL 语句可以分为以下三类.

  • DDL

DDL(Data Definition Language,数据定义语言) 用来创建或者删除存储数据用的数据库以及数据库中的表等对象。DDL 包含以下几种指令。

  • CREATE : 创建数据库和表等对象

  • DROP : 删除数据库和表等对象

  • ALTER : 修改数据库和表等对象的结构

  • DML

DML(Data Manipulation Language,数据操纵语言) 用来查询或者变更表中的记录。DML 包含以下几种指令。

  • SELECT :查询表中的数据

  • INSERT :向表中插入新数据

  • UPDATE :更新表中的数据

  • DELETE :删除表中的数据

  • DCL

DCL(Data Control Language,数据控制语言) 用来确认或者取消对数据库中的数据进行的变更。除此之外,还可以对 RDBMS 的用户是否有权限操作数据库中的对象(数据库表等)进行设定。DCL 包含以下几种指令。

  • COMMIT : 确认对数据库中的数据进行的变更

  • ROLLBACK : 取消对数据库中的数据进行的变更

  • GRANT : 赋予用户操作权限

  • REVOKE : 取消用户的操作权限

实际使用的 SQL 语句当中有 90% 属于 DML,本课程会以 DML 为中心进行讲解。

2.2 SQL的基本书写规则

  • win 系统默认不区分表名及字段名的大小写
  • 单词需要用半角空格或者换行来分隔

SQL 语句的单词之间需使用半角空格或换行符来进行分隔,且不能使用全角空格作为单词的分隔符,否则会发生错误,出现无法预期的结果。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值