- 套题
商汤20年秋招智慧城市-数据运营工程师笔试题 - 题型
选择 * 20 + 问答 * 3 - 完成时间
60分钟
❤️ 「更多数据分析真题」
《数据分析真题日刷 | 目录索引》
❤️ 「更多我的秋招经验贴」
《2020我的秋招总结帖 [数据分析岗] | 目录索引》
一、选择题
主要考察以下:
-
基础的统计学
1)贝叶斯
2)条件概率
3)偏态判断、
4)独立、相关、期望、方差、协方差等,围绕Cov(X,Y) = EXY - EX * EY这个公式展开。其他忘了
-
基础的机器学习
1) K-NN
2)距离(曼哈顿、欧式、bregman等)
3)k-means
4)关联分析(支持度、置信度等)
5)Precision、Recall、ROC等
其他忘了,考的不深。
-
大数据方面的理解性知识
感觉像是《大数据时代》这种科普书里的,一些介绍性、理解性的知识。比如,数据对企业最重要的是什么方面? (我也不知道啊……)
二、问答题
- 缺失值的处理
- 中心极限定理
- SQL
已知职工表,(自己生成的数据)
查找每个部门中月工资最高的“职工号”;
1) 给出了子查询嵌套的SQL代码,评价效率;
2)自己写代码,提高效率。
CREATE VIEW vv AS
SELECT *, RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS r
FROM emp_table;
SELECT department, emp_id, salary FROM vv where r=1;
output:
⚠️注意:窗口函数用RANK() OVER 比row_number更合适。因为,如果按照row_number编号后,取每组内第一行记录,则忽略了并列的情况。比如,本例子中,emp_id = 2 和emp_id =3 是并列的,按照rank = 1两个都会被选中, 按照row_number 只会取中其中一条记录。
三、总结
- 整体难度不大,偏重基本概念的掌握。
「举一反三」
部分题目高度相似牛客网真题,差不多的题干,一样的解题方法,整理如下:
- 《京东2018秋招数据分析工程师笔试题》第14题
- 《京东2018秋招数据分析工程师笔试题》第32题;
- 《招商银行信用卡中心2019秋招IT笔试(数据挖掘方向第二批)》第2题;
- 《招商银行信用卡中心2019秋招IT笔试(数据挖掘方向第二批)》第10题;
- 《招商银行信用卡中心2019秋招IT笔试(数据挖掘方向第二批)》第28题;
- 《小红书2019年校园招聘数据分析岗位在线笔试第二批》第2题;
- 《京东2019校招数据分析工程师笔试题》第57题;
- 《京东2019春招京东数据分析类试卷》第20题;
- 《京东2019春招京东数据分析类试卷》第22题;
所以,及时复习和重温做过的知识点,也很重要啊……