sql左关联和(+)哪个快_北京&上海 | 给数据新人准备的SQL入门课

本文介绍了SQL作为数据查询语言的重要性,强调无论在何种数据分析背景,Excel和SQL都是必备技能。通过实例解释了SQL的基本操作,如查询、更新和管理数据,并纠正了将SQL视为数据库的误解。课程旨在通过50多个案例帮助学员掌握SQL,适合Excel用户、数据分析师和对此感兴趣的人群,覆盖SQL基础、数据分析函数、多表关联查询和子查询等内容。
摘要由CSDN通过智能技术生成

5845d7d3bbb63961032df011807dc8e8.png

任何从事数据分析行业的人,都至少要精通一两个数据分析软件。大家熟知的软件有Excel、SPSS、R、Python、SQL、Tableau、SAS、Power BI等。数据新人最大困惑之一是这么多软件到底该学哪个!

答案是:不一定。因为每家公司采用的技术路线不一样,导致员工个人需要精通的技术也大有不同。比如使用Tableau的公司一般不会再使用Power BI,因此员工也就只能深入研究Tableau,而非Power BI。同理,使用Python的公司一般不会使用R,使用SAS的公司一般不会使用SPSS。总之,你所在公司采用的技术栈,很大程度上决定了你的技术栈。

注释:以上观点并不绝对,确实有公司同时Python和R,但总体上公司都会有一定的技术标准,以降低内部的沟通成本。

但在所有技术中有两个例外,无论你在什么样的公司做数据,这两个工具都是必备的技能——:Excel和SQL。我们随手从拉勾网找到三个数据相关岗位要求,无一例外都要求掌握Excel和SQL。

美团点评数据分析师岗

9b8a814f54d4c61d1b710e4f6c4ee8b8.png

今日头条数据分析师

7a69efccd3a88b1f025e1f687e51d8c9.png

摩拜单车BI数据分析师

69e68a811af1d52c3be11ed39365ba1e.png

下面我们就为大家讲讲到底什么是SQL。

SQL是什么,不是什么

SQL是一种数据库查询语言

SQL是Structured Query Language的缩写,中文叫结构化查询语言很多人误以为SQL和Python、R、JAVA一样是一门高深的、面向专业人员的编程语言,这是巨大的误解。SQL是一种特殊目的(短小精湛)的编程语言,专门用于查询、更新和管理数据。

SQL和Python等程序语言的重大区别是SQL语言是告诉计算机你想从原始数据中得到什么样结果的一段声明,而不是告诉计算机如何得到结果的算法/逻辑,因此极大降低了语法的复杂性。仔细回忆一下,绝大部分情况下我们对数据的操作无外乎:

1.增加数据(insert);

2.删除数据(delete);

3.修改数据(update);

4.按指定条件过滤数据(where);

5.按指定维度对数据进行加减乘除(group by)。

举个例子,假设我们的数据库中有一张叫“书籍信息”的表(类似于Excel的一个sheet页),表中存储了书名、作者、价格等基本信息。我们希望查询《SQL必知必会》的作者和价格,SQL代码:

select 书名, 作者, 价格
from 书籍信息
where 书名 = '《SQL必知必会》'

上面代码中select、from和where是SQL固定语法,select用于从表中选出你想要的列,from用于决定从哪张表中找,where则是数据的筛选条件。

再比如,查询价格最高的书,SQL代码:

select 书名, 作者, MAX(价格)
from 书籍信息
group by 书名,作者

上面的代码中MAX用于计算“价格”字段的最大值,group by用于指定聚合字段,输出结果是价格最高的书目清单。

SQL不是数据库

很多小白误以为SQL是数据库,实际则不然。SQL仅仅是通用的数据库查询语言,MySQL、Oracel、SQL Server才是真正企业部署的数据库(数据库还有其它厂商)。

事实上,自1987年起,SQL便成为数据库的国际标准,各家数据库产品都使用SQL作为共同的数据存取语言和标准的接口,使不同数据库系统之间的互操作有了共同的基础。虽然各家都对SQL规范作了编改和扩充,但对于数据分析师而言,只是部分语法和实现细节不一致而已,并不会严重影响数据分析工作。

ea66a4b378ca5e4cbf5dbc0bbecd7bef.png

我们才是数据库,SQL是我们共同的语言

SQL究竟能做什么?

数据预处理

SQL是在数据库中运行的语言,在运行效率和通用性上都好于第三方软件,是数据预处理最常用的语言之一。

继续之前的例子,我们希望在查询结果中增加作者的性别和年龄,此时需要关联一张存储了作者信息的表,SQL代码:

select 书名, 作者, 价格,作者性别,作者年龄
from 书籍信息
join 作者信息
on 书籍信息.作者 = 作者信息.作者

上面的代码中join用于对多张表进行关联(类似于Excel中的vlookup),on则指定了两张表用于关联的共同字段。

有时我们希望将查询结果保存起来,以便未来继续使用,此时就可以将查询结果保存为一张表(Table)或虚拟化的视图(View),前者是数据库中存有数据的实实在在的一张表,后者则只是你编写的查询语句,数据是子在你使用视图的时候才会实时查询生成。视图的优点是可以保证数据永远是最新的,缺点是查询速度慢,这很容易理解。

create view 书籍和作者信息as
select 书名, 作者, 价格,作者性别,作者年龄
from 书籍信息
join 作者信息
on 书籍信息.作者 = 作者信息.作者

上面的代码中create view ... as用于创建一个名叫“书籍和作者信息”的视图,以保存查询结果。未来我们只需要写下面的SQL代码即可,是不是非常便捷?

select 书名, 作者, 价格,作者性别,作者年龄
from 书籍和作者信息

看到SQL代码和功能如此简单,有些人可能会怀疑SQL的能力是不是仅限于查查数、做做表关联,当然不是!

简单的“机器学习”

SQL自诞生起已经超过30年,和新潮的机器学习比起来,有种廉波老矣的感觉。但Celestine Omin在《SQL足以解决你的问题,别动不动就是机器学习》一文中则展示了从实用主义的角度,SQL如何轻松搞定“机器学习”——代价远比采用ML/AI要低。

对于在 SLA 时间窗口内未能发货的订单,我们也使用 SQL 查询来管理客户期望。我们选择处于未交付状态的订单,比如订单日期>=7 天,因为这是标准的交付周期。然后我们设置 CRON 作业,向客户发送电子邮件和短信。虽然顾客没有立即跳起来为我们鼓掌,但至少,我们向他们保证,我们关心着他们,并正在努力解决问题。没有什么比订单延迟更烦人的了。
这个特殊的解决方案也对我们的 NPS 产生了巨大的影响。我们依旧使用老旧的 SQL 和 Bash 解决了我们的难题。
Sift Science 在预防欺诈方面做得非常出色,但其实 SQL 也可以派上用场。如果一个人试图同时用 3 张不同的卡结账,并且这些卡都是空头,那么就会发生一些有趣的事情。我们首先要暂时阻止他们的账户,这样可以为真正的卡片所有者节省很多麻烦。我们不需要保存卡片的详细信息,只需保存特定订单号的结账操作,这样就可以了。这些都不需要使用机器学习,只要编写良好的 SQL 就够了。
我可能是在说 ML/AI 的坏话。这些技术有它们的用武之地,亚马逊已经证明了这些技术的有效性。但是,如果你正在运营一个拥有 1,000 到 10,000 个客户的小型在线商店,那么完全可以只用 SQL。此外,ML/AI 人才并不好找。

你还会怀疑SQL的能力吗?你能想多远,SQL就能走多远。

课程介绍

本课程由10年以上工作经验的数据仓库专家亲力打造,用一个零售企业数据库贯穿全课程,通过50多个实用案例,一步一步引导你理解数据库的运行机制、SQL的核心语法,以及如何和数据库成为朋友。

你能获得什么?

学员完成所有案例和毕业项目之后,将具有使用SQL独立进行数据处理、汇总分析的能力,能够通过初中级商业分析师的SQL笔试。

总之,在实战和面试中必知必会的SQL技能,这里都有!

适合人群

  • 希望向更高薪资岗位转型的Excel表哥表姐
  • 希望通过SQL进行数据预处理,提升Tableau、Power BI等工具数据可视化分析能力的用户
  • 对数据分析思维、计算机编程思维感兴趣的人群

(无需编程基础,即学即用)

课程安排

价格:¥1080,早鸟:¥780(2月22日前报名有效)

8小时现场课程+录播提供+2周在线问答+毕业项目指导+结业证书

时间:3月10日,9:00-18:00,现场小班授课(课后提供全程录像)

地点:

  • (北京朝阳)双井双花园小区南里3区21-1室阅咖啡
  • (上海普陀)长寿路97号世纪商务大厦

报名方式

扫码进入活动行报名,请填写完整准确的报名信息,审核通过后付款即为报名成功。

北京 | 给数据新人准备的SQL入门课​www.huodongxing.com
e7b471df0ed2803329f45ea7ae2ab6a5.png
上海 | 给数据新人准备的SQL入门课​www.huodongxing.com
e7b471df0ed2803329f45ea7ae2ab6a5.png

课程大纲

一、初识数据库

  1. 主流数据库介绍
  2. 关系型数据库基础(库、表、行、列、数据类型、主键、外键的含义)
  3. 理解关系型数据库(ERD、数据库建模)
  4. 案例实战:认识一家零售企业的销售管理数据库

二、SQL基础语法

  1. 掌握SQL常用的关键字
  2. 掌握排序、数据过滤的方法
  3. SQL代码整洁之道
  4. 案例实战:完成指定的数据查询任务

三、数据分析函数

  1. 掌握数据分析函数的用法,包括排名、求和、最大值、最小值、平均值、中位数等
  2. 常用的日期处理函数
  3. 案例实战:完成指定的数据分析查询任务

四、多表关联查询

  1. 多表关联的原理
  2. 多表关联的语法,包括左关联、右关联、内关联和外部关联
  3. 如何选择正确的表关联方式
  4. 案例实战:完成指定的多表关联数据分析任务

五、子查询

  1. 子查询的使用场景
  2. 使用子查询进行条件过滤
  3. 案例实战:完成指定的子查询数据分析任务

六、SQL Tips

  1. SQL语句执行顺序
  2. 执行性能
  3. 视图 vs 表
  4. 可怕的空:NULL

七、数据分析案例实战

  1. 基于给定的零售企业销售数据,完成以下"客户专题分析"任务:
  2. 找出满足给定条件的关键客户
  3. 找出合作时间最长的Top N客户
  4. 找出各地区销售额最高的Top N客户
  5. 客户购买频次分析
  6. 客户销售额80/20分析

八、数据库专家工作经验分享

毕业项目

在给定时间内,完成30道SQL实战面试题。

讲师介绍

2423b280247ac0a83a1146cc3d446816.png

梁蓓蓓,10年数据仓库工作经验,曾获2014年阿里巴巴数据科学家大赛“最强营销分析师”头衔,热爱数据,热爱可视化。曾在COSCO、eBay等企业从事BI相关工作,目前从事数据产品相关工作。

助教

2b382141a2db0865a5cdd7736f6314fe.png

Forrest,专注数据领域6年,BI团队负责人,持有Tableau QA认证、微软数据科学认证,精通Tableau和数据可视化,译著《深入浅出数据科学》。

60fae245b7ce45acc1a68a9423a900ef.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值