商汤科技20年秋招智慧城市-数据运营工程师笔试题(2019.8.19)

  • 套题
    商汤20年秋招智慧城市-数据运营工程师笔试题
  • 题型
    选择 * 20 + 问答 * 3
  • 完成时间
    60分钟

❤️ 「更多数据分析真题」
数据分析真题日刷 | 目录索引

❤️ 「更多我的秋招经验贴」
2020我的秋招总结帖 [数据分析岗] | 目录索引


一、选择题

主要考察以下:

  1. 基础的统计学

    1)贝叶斯
    2)条件概率
    3)偏态判断、
    4)独立、相关、期望、方差、协方差等,围绕Cov(X,Y) = EXY - EX * EY这个公式展开。

    其他忘了

  2. 基础的机器学习

    1) K-NN
    2)距离(曼哈顿、欧式、bregman等)
    3)k-means
    4)关联分析(支持度、置信度等)
    5)Precision、Recall、ROC等

其他忘了,考的不深。

  1. 大数据方面的理解性知识

    感觉像是《大数据时代》这种科普书里的,一些介绍性、理解性的知识。比如,数据对企业最重要的是什么方面? (我也不知道啊……)


二、问答题
  1. 缺失值的处理
  2. 中心极限定理
  3. SQL

已知职工表,(自己生成的数据)
在这里插入图片描述
查找每个部门中月工资最高的“职工号”;

1) 给出了子查询嵌套的SQL代码,评价效率;
2)自己写代码,提高效率。

CREATE VIEW vv AS
SELECT *, RANK() OVER (PARTITION BY department ORDER BY salary DESC) AS r
FROM emp_table;

SELECT department, emp_id, salary FROM vv where r=1;

output:
在这里插入图片描述

⚠️注意:窗口函数用RANK() OVER 比row_number更合适。因为,如果按照row_number编号后,取每组内第一行记录,则忽略了并列的情况。比如,本例子中,emp_id = 2 和emp_id =3 是并列的,按照rank = 1两个都会被选中, 按照row_number 只会取中其中一条记录。


三、总结
  1. 整体难度不大,偏重基本概念的掌握。
「举一反三」

部分题目高度相似牛客网真题,差不多的题干,一样的解题方法,整理如下:

所以,及时复习和重温做过的知识点,也很重要啊……

评论 16
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值