c++多数据平均数_每周 面试题 | 小红书2019数据分析笔试题

- 点击上方 “中国统计网” 设置⭐星标不迷路!- b822de55e9e7461c27d82106ffa2be56.gif

每周·面试题 周五更新

本专栏的面试题可以作为 练习、补充题库、自检能力 在做题的过程中遇到问题 可以在 评论区留言 给小编 或者直接找 职场老师1对1解答 哦!!ff53a8d31616da7b14361fef1b3c7228.png (每周五更新,公众号菜单栏有直达入口)

小红书数据分析岗位试题

 —— 第1题 —— 

1. 从含有N个元素的总体中抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为?

A. 简单随机抽样

B. 分层抽样

C. 系统抽样

D. 整群抽样

答案:A


 —— 第2题 —— 

2. 一组数据,均值>中位数>众数,则这组数据

A. 左偏

B. 右偏

C. 钟形

D. 对称

答案:B

「题目解析」

分布形状由众数决定, 均值大于众数的化,说明峰值在左边,尾巴在右边,所以右偏。偏态是看尾巴在哪边。


 —— 第3题 —— 

3. 对一个特定情形的估计来说,置信水平越低,所对应的置信区间?

A. 越小

B. 越大

C. 不变

D. 无法判断

答案:A

「题目解析」

9ebf9d2f89d67b5501bcf4fce0a6a94c.png

根据公式,Z减小,置信区间减小。


 —— 第4题 —— 

4.关于logistic回归算法,以下说法不正确的是?

A. logistic回归是当前业界比较常用的算法,用于估计某种事物的可能性

B. logistic回归的目标变量可以是离散变量也可以是连续变量

C. logistic回归的结果并非数学定义中的概率值

D. logistic回归的自变量可以是离散变量也可以是连续变量

答案:B

「题目解析」

  • 逻辑回归是二分类的分类模型,故目标变量是离散变量,B错;

  • logisitc回归的结果为“可能性”,并非数学定义中的概率值,不可以直接当做概率值来用,C对。


 —— 第5题 —— 

5.下列关于正态分布,不正确的是?

A. 正态分布具有集中性和对称性

B. 期望是正态分布的位置参数,描述正态分布的集中趋势位置

C. 正态分布是期望为0,标准差为1的分布

D. 正态分布的期望、中位数、众数相同

答案:C

「题目解析」

N(0,1)是标准正态分布。


 —— 第6题 —— 

6. 以下关于关系的叙述中,正确的是?

A. 表中某一列的数据类型可以同时是字符串,也可以是数字

B. 关系是一个由行与列组成的、能够表达数据及数据之间联系的二维表

C. 表中某一列的值可以取空值null,所谓空值是指安全可靠或零

D. 表中必须有一列作为主关键字,用来惟一标识一行

E. 以上答案都不对

答案:B

「题目解析」

B. 关系是一张二维表,表的每一行对应一个元组,每一列对应一个域,由于域可以相同,所以必须对每列起一个名字,来加以区分,这个名字称为属性。


 —— 第7题 —— 

7. 想要了解一个地区人群的一般收入水平,以下什么指标不能使用?

A. 方差

B. 几何平均数

C. 众数

D. 中位数

E. P值

答案:B E

「题目解析」

几何平均数:几何平均数是对各变量值的连乘积开项数次方根。求几何平均数的方法叫做几何平均法。如果总水平、总成果等于所有阶段、所有环节水平、成果的连乘积总和时,求各阶段、各环节的一般水平、一般成果,要使用几何平均法计算几何平均数,而不能使用算术平均法计算算术平均数。根据所拿握资料的形式不同,其分为简单几何平均数和加权几何平均数两种形式。


 —— 第8题 —— 

8. 以下属于聚类算法的是?

A. ARIMA

B. 朴素贝叶斯

C. 支持向量机

D. K-MEANS

答案:D

「题目解析」

A.时间序列

B.C. 分类模型

D 聚类


 —— 第9题 —— 

9. 样本中各观察值均加5后?

A. 方差加25

B. 标准差加5

C. 均值加5

D. 中值加5

答案:C D

「题目解析」

样本中各观察值均加5后,标准差和方差不变,均值和中值加5。因为标准差反映数据的离散程度,所有观察值相同的变化,对波动没有影响。举个例子,样本中3个观察值都为1,则方差为0。样本中每个观察值均加5,变成3个5,方差还是0。


 —— 第10题 —— 

10. 一批零件共10个,其中有3个不合格品,从中一个一个不放回取出,则第三次才取得不合格品的概率是?(填小数)

答案:0.175

「题目解析」

(7/10) * (6/9) * (3/8) = 0.175


 —— 第11题 —— 

11. 某业务线的营业收入为:200,220,250,300,320万元,则平均增长量为?万元

答案:30

「题目解析」

平均增长量 = 累计增长量 / (时间数列项数-1)=(320-200)/(5-1)=30

误区:是除以4 不是5!!!


 —— 第12题 —— 

12. 如下两张表, name_t 和 age_t:

name_t

7f2ac6107776608950482837d0e54040.png

age_t

1e3667198f3f150b648b7e1af7061ddd.png

结合表信息,写出sql的最终结果

SELECT     count(t1.ID) as cnt FROM     name_t t1  LEFT JOIN     age_t t2 ON     t1.ID = t2.ID WHERE     t2.Age > 22 

答案:1

「题目解析」

74891d469f38c611b0c437582ab1b82d.png

关于sql表连接的知识点

只有John符合条件,故为1。


 —— 第13题 —— 

13. 请写sql语句:

想要了解班级内同学的考试情况,现有一张成绩表表名为A,每行都包含以下内容(已知表中没有重复内容,但所有的考试结果都录入在了同一张表中,一个同学会有多条考试结果):

student_id,course_name,score

现在需要知道:

  • 每门课程得到成绩的同学人数

  • 每门课程的平均成绩

  • 如果对于每门课程来说,60分以下为不及格,高于60为及格,统计每门课程及格和不及格的人数

「题目解析」

官方答案:

1.2.select    course_name    ,count(distinct student_id) as student_num    ,avg(score) as avg_scorefrom Agroup by 13.select    course_name    ,case when score < 60 then '不及格'        else '及格' end as level    ,count(student_id) as student_numfrom Agroup by 1,2

我自己生成了数据如下:

9d9099f38e61ac728054415394ab65dd.png

-- 参考答案第3问select    course_name    ,case when score < 60 then '不及格'        else '及格' end as level    ,count(student_id) as student_numfrom Agroup by 1,2

输出如下:

17cfaa9743266e755a95b611a3a014db.png

我的代码:

-- 我的答案,第三问SELECT course_name, SUM(CASE WHEN score >= 60 THEN 1 ELSE 0 END ) AS '及格',SUM(CASE WHEN score <60 THEN 1 ELSE 0 END) AS '不及格'FROM AGROUP BY course_name;

输出:

7529ba52b33a24c6aa5bebb48f2116ad.png


 —— 第14题 —— 

14. 经一番研究后,我们开发出了一个新的商品详情页中’相关商品’模块的算法,并且打算通过AB Test(50%用户保留原先的算法逻辑为控制组,50%用户使用新的算法逻辑为实验组)来进行评估。假如你是此次实验的数据分析师,请问你会怎么评估控制组和实验组的表现?请按重要性列出最重要的三个指标并给出你的分析过程。

「题目解析」

  • 相关商品的点击率=相关商品链接点击次数/当前页面浏览次数

  • 相关商品的购买率=购买行为发生次数/相关商品浏览行为次数

  • 当前商品与相关商品一同购买的概率=共同购买/当前商品购买

End. 作者:圣洁不吃冰淇淋 来源:CSDN https://blog.csdn.net/weixin_44915703/article/details/94743360 本文为转载分享,若侵权请联系后台删除

往期小编推荐  

点击标题即可阅读??

项目分享丨「数据分析师」怎么做一个“有用”的项目?

干货技巧丨数据岗位常考!如何用Vlookup数组公式做逆向查找?

理论知识丨10个最经典的数据分析模型,你集齐了几个?

ad7160ade76e875328458e0f55bd8de6.png 89c17dd40c3727fdb51cf1d83098dcf0.png  点分享  236a96f7f5d8137cffbfc41c74742f8d.png  点点赞  489e1084dc4d001b0365e8755d653d7a.png 点在看 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值