本文转载自数据管道,详情可扫描下方二维码:
这两天私信讨论问题的朋友挺多的,我也都回复了,响应其中一个读者的朋友的要求。
“请问有SQL或者数据分析的面试题吗?”
说实话,我真没刷过题,上上周群里有朋友问了一道sql题,那种难度级别已经够你面任何一家公司了。所以,没做出来也很正常,我之所以会做也只是因为用的多而已。再套路一点的问题无非就是,"为什么hive select count distinct 查询的reduce一直卡在99%,这可能是什么原因导致的,你有什么解决方法"。
这里强调一下,不是说你做出来了这些题,SQL很熟练大厂就会要你,今年的分析师岗位不太好找,如果你还是一直在努力爬虫、熟练Python、为了分析而分析的阶段,建议去找爬虫工程师或者Python开发,不会有一家大厂要你做分析师的。
因为,你一开始就错了,Python是Python,分析是分析,请真的不要把Python和数据分析画上等号。对分析师来说,熟知业务的重要性远比你会一两个工具重要,而论重要性,SQL的重要性比Python重要的多(这里不是让你不去学Python哈,宝器每天也还是要写写Python的)。再配一张有趣的图:
很多在学校的朋友会觉得算法工程师巨厉害,上手就是达模型,这么说吧,差不多算法工程师的实习工作大部分时间就是写SQL(CV那一块的不太了解,如果说错了,还请不要diss)。为什么要你写SQL,因为你连特征工程都做不好,就别扯回归、分类这些东西了。
就好像做推荐的朋友第一步需要把用户画像建好,而画像核心就是各类分层标签,埋点上报再到数仓的数据是明细表,明细表的数据不会给你做好这些标签的,所以第一步你就是需要用SQL把各类标签表做出来,而后在定用户画像。
好了,言归正传。今天做了一下sql zoo上面的题,还算有趣的一个做题网站。大致几部分内容:基础、关联子查询、聚合函数、JOIN等等,不算太难。
比较有趣的是,每次你提交代码对了会给你一个笑脸,如下:
每做完一个章节的题,还附带一个选择题小测验,不错的一个功能~
附上网址,点阅读原文也可访问:
https://sqlzoo.net/
另外,已将全部章节的可以运行成功的答案记录下来,篇幅太大,不全部展示了,一会丢到群里:
◆ ◆ ◆ ◆ ◆
长按二维码关注我们
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
管理员二维码: