做了点SQL题。

本文转载自数据管道,详情可扫描下方二维码:

这两天私信讨论问题的朋友挺多的,我也都回复了,响应其中一个读者的朋友的要求。

“请问有SQL或者数据分析的面试题吗?”

说实话,我真没刷过题,上上周群里有朋友问了一道sql题,那种难度级别已经够你面任何一家公司了。所以,没做出来也很正常,我之所以会做也只是因为用的多而已。再套路一点的问题无非就是,"为什么hive select count distinct 查询的reduce一直卡在99%,这可能是什么原因导致的,你有什么解决方法"。

这里强调一下,不是说你做出来了这些题,SQL很熟练大厂就会要你,今年的分析师岗位不太好找,如果你还是一直在努力爬虫、熟练Python、为了分析而分析的阶段,建议去找爬虫工程师或者Python开发,不会有一家大厂要你做分析师的。

因为,你一开始就错了,Python是Python,分析是分析,请真的不要把Python和数据分析画上等号。对分析师来说,熟知业务的重要性远比你会一两个工具重要,而论重要性,SQL的重要性比Python重要的多(这里不是让你不去学Python哈,宝器每天也还是要写写Python的)。再配一张有趣的图:

640?wx_fmt=jpeg

很多在学校的朋友会觉得算法工程师巨厉害,上手就是达模型,这么说吧,差不多算法工程师的实习工作大部分时间就是写SQL(CV那一块的不太了解,如果说错了,还请不要diss)。为什么要你写SQL,因为你连特征工程都做不好,就别扯回归、分类这些东西了。

就好像做推荐的朋友第一步需要把用户画像建好,而画像核心就是各类分层标签,埋点上报再到数仓的数据是明细表,明细表的数据不会给你做好这些标签的,所以第一步你就是需要用SQL把各类标签表做出来,而后在定用户画像。

好了,言归正传。今天做了一下sql zoo上面的题,还算有趣的一个做题网站。大致几部分内容:基础、关联子查询、聚合函数、JOIN等等,不算太难。

640?wx_fmt=png

 比较有趣的是,每次你提交代码对了会给你一个笑脸,如下:

640?wx_fmt=png

每做完一个章节的题,还附带一个选择题小测验,不错的一个功能~

640?wx_fmt=png

附上网址,点阅读原文也可访问:

https://sqlzoo.net/

另外,已将全部章节的可以运行成功的答案记录下来,篇幅太大,不全部展示了,一会丢到群里:

640?wx_fmt=png

◆ ◆ ◆  ◆ ◆

长按二维码关注我们


数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。

管理员二维码:

猜你喜欢

 

第二天 1、查询客户表,统计每个机构2000年之前开户数、2000~2005开户数(含头不含尾)、2005~2010开户数(含头不含尾)、2010之后开户数 展示字段:机构号、2000年之前开户数、2000~2005年开户数、2005~2010年开户数、2010年之后开户数 2、查询客户表,按年份统计,每年、每个机构开户数占全年开户数的占比 展示字段:年份、机构号、开户数、开户占比百分比(百分比) 3、统计所有客户的客户号、存款账户数、2011.12.31日的存款余额、2011.12存款月日均、贷款账户数、2011.12.31日的贷款余额、2011.12贷款月日均 备注:null置为0 第三天 1、统计所有客户的2011.12.31日的存款余额、存款比上日余额、存款比上月余额、、存款比上年余额 备注:存款比上日余额 = 2011.12.31日的存款余额-2011.12.30日的存款余额 存款比上月余额 = 2011.12.31日的存款余额-2011.11.30日的存款余额 存款比上年余额 = 2011.12.31日的存款余额-2010.12.31日的存款余额 只有2011.12.31这个日期可以写死,其他日期要通过2011.12.31这个日期来生成。 2、统计所有2011年存款年日均大于100的客户号、客户名称、存款账户数、2011年年日均 第四天 1、统计所有2011年存款年日均和2011年贷款年日均都大于100的客户号、存款账户数、2011年存款年日均、贷款账户数、2011年贷款年日均 2、统计所有客户的客户号、 存款标志(有存款账户的客户置为1、没存款账户的客户置为0)、 贷款标志(有贷款借据的客户置为1、没贷款借据的客户置为0)、 存款质量分类(2011年存款年日均>=10000置为优质、2011年存款年日均>=1000<10000 置为良好、2011年存款年日均=10000置为优质、2011年贷款年日均>=1000<10000 置为良好、2011年贷款年日均<1000置为普通)、 2011年贷款年日均 第五天 1、根据《事件表.xlsx》来建表,然后将excel中的数据导入到目标表中 2、根据客户表、存款信息表、事件表,统计每个客户2017年的客户号、 交易账户数(客户下有多少个账户有交易就是多少)、 当年有交易的天数(如果2017年有5天有过交易,则有交易天数为5)、 当年有交易总月数(如果2017的1、3、5月有交易,则有交易总月数为3)、 最大的月交易总金额(按月统计交易金额,存放最大的月交易金额)、 最大月交易金额的月份(按月统计交易金额,存放交易金额最大的月份)、 年总交易金额、 年交易金额排名(按客户排名,如果总交易金额为0,则不参与排名,排名置为9999)、 年总手续费、 年总手续费排名(按客户排名,如果总手续费为0,则不参与排名,排名置为9999)
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值