【牛客】网易2018校园招聘数据分析工程师笔试卷

【牛客】网易2018校园招聘数据分析工程师笔试卷解析

* 选择题根据牛客网下方讨论整理,三道大题未做,欢迎大家讨论并给予指正。

https://www.nowcoder.com/test/10730167/summary

一、选择题

1、某二叉查找树的每个节点存放一个整数,中序遍历该树得到的序列为3,4,5,则该树的画法有多少种情况?

答:5

 

2、字符串有5个字符q,w,e,r,t,出现的频率分别为1,2,3,4,5,如果采用Huffman编码对字符串编码,则每个字符编码的平均长度是()?

答:2.4

Huffman编码后分别为:q:000,w:001,e:01,r:10,t:11,平均编码长度为(3+3+2+2+2)/5=2.4。

 

3、下面关于排序的空间复杂度说法不正确的有()(N为被排序数据的长度)

答:插入排序的空间复杂度为O(N)

正确答案:堆排序的空间复杂度为O(1);冒泡排序的空间复杂度为O(1);归并排序的空间复杂度为O(N);递归实现的快速排序的空间复杂度为O(logn)

插入排序的空间复杂度为O(1)

 

4、一个简单无向图有10个顶点,11条边,如果用邻接矩阵来存储它,那么矩阵里面会有多少个0?

答:78 = 10^2-2*11

 

5、以下hive sql语法正确的是

答:select * from a inner join b on a.id=b.id

select * from a inner join b on a.id<>b.id,错在lt,gt符号?

select * from a where a.id in (select id from b),in后不可以接子查询

select sum(a.amt) as total from a where a.total>20,错在lt,gt符号?

 

6、以下关于hive以及Hadoop生态系统中其他组件的说法正确的是

答:Hbase是一个面向列分布式数据库,和hive不同的是,hbase能够在它的数据库上实时运行,而不是运行mapreduce任务

错误答案:Hbase依赖HDFS存储数据,实现的编程语言为Java;hive不支持数据更新,延迟比较小,可用于实时查询系统;hive采用了SQL的查询语言HQL,其支持了SQL中的所有特性

 

7、大表1000万条数据, 小表1000条数据, 为提高查询效率两行表关联时通常做法是

答:大表在前

表在前,后面的小表会进行全表扫描

 

8、有一个地区有2个市,一个来自A市的概率是20%,B市的是80%,A市得病的概率是2%,B市得病的概率是3%,现在有一个病人,问是A市的概率是?

答:0.2*0.02/(0.2*0.02 + 0.8*0.03)= 1/7

 

9、x+y+z+m=10,其中x,y,z,m都是正整数,那么x,y,z,m有多少种不同的取值组合?

答:84 = c(9,3)

插空法,10个1,有9个空位,选择3个空分割

 

10、有无限多水源,一个4L无刻度桶和一个9L无刻度桶,只利用这2个无刻度桶,将不可能获得____L水。

答:1、3、8、7、11、以上均能获得

1:9L往4L倒两次 剩1L
2:7L装满,倒满5L,剩2L
3:5L装满,倒7L;再装满5L,倒满7L,剩3L
6:5L装满,倒7L;再装满5L,倒满7L,剩3L;倒给7L,5L装满,再倒满7L,剩1L;倒给7L,5升装满,共6L。
8:5L装满,倒7L;再装满5L,倒满7L,剩3L;倒给7L,5L装满,共8L
11:7L装满,倒满5L,剩2L;倒给5L,7L装满,再倒满5L,剩4L;倒给5L,7L倒满,共11L

 

11、有一堆石子,共80颗,甲,乙轮流从该堆中取石子,每次可以取2,4或者6颗,取得最后的石子的玩家为赢家,甲乙都足够聪明都想赢,若甲先取,则____。

答:乙必胜

80就是8的倍数,甲无法拿八颗,乙后拿,能拿到第8颗或者8的倍数,所以肯定赢

 

12、A, B 为任意两个事件且 A ⊂ B,P(B) > 0,则下列选项必然成立的是( )

答:P(A) ≤ P(A| B)

错误答案:P(A) < P(A| B);P(A) ≥ P(A| B);P(A) > P(A| B)

P(A| B)限定了b为全集,全集缩小,故P(A) ≤ P(A| B)

 

13、将一枚硬币独立地掷两次,引进事件: A1 = {掷第一次出现正面}, A2 = {掷第二次出现正面},
A3 = {正、反面各出现一次}, A4 = {正面出现两次},则事件( )

答:A1, A2, A3两两独立;

错误答案:A1, A2, A3相互独立;A2, A3, A4相互独立;A2, A3, A4两两独立

因为:P(A1)=1/2,P(A2)=1/2,P(A3)=1/2,P(A4)=1/4

且  P(A1A2)=1/4,P(A1A3)=1/4,P(A2A3)=1/4,P(A2A4)=1/4,P(A1A2A3)=0

从而有:
①P(A1A2)=P(A1)P(A2),
②P(A1A3)=P(A1)P(A3),
③P(A2A3)=P(A2)P(A3),
④P(A1A2A3)≠P(A1)P(A2)P(A3),
⑤P(A2A4)≠P(A2)P(A4).
故:A1,A2,A3两两独立但不相互独立;A2,A3,A4不两两独立更不相互独立

 

14、设随机变量 X 与 Y 均服从正态分布,X ~ N(µ, 16), Y ~ (µ, 25), 记p1 = P{X ≤ µ - 4}, p2 = P{Y ≥ µ + 5}, 则()

答:对任何实数µ,都有 p1 = p2

在“正态分布”中,σ表征概率密度曲线的“宽度”,或展开的程度.不管μ和σ的值如何,区域[μ-σ, μ+σ]都覆盖68.26%的概率.

 

15、设随机变量X与Y相互独立,且都服从区间(0,1)上的均匀分布,则P{X^2 + Y^2 ≤ 1} =( )

答:π/4,四分之一单位圆的面积/1

 

16、随机变量X ~ N(0, 1), Y ~ N(1, 4),且相关系数ρ{XY} = 1,则( )

答:P{Y = 2X + 1} = 1

y=ax+b,正相关a>0,E(ax+b)=aE(x)+b=b,b=1,即y=ax+1,D(Y)=a^2*D(x)=4,a=2

 

17、设随机变量X和Y都服从正态分布,且它们不相关,则( )

答:X与Y未必独立

错误答案:(X, Y)服从二维正态分布、X与Y一定独立、X + Y服从一维正态分布

A.只有当(X,Y) 服从二维正态分布时,X与Y不相关⇔X与Y独立,本题仅仅已知X和Y服从正态分布,因此,由它们不相关推不出X与Y一定独立,故A错误; 
B.若X和Y都服从正态分布且相互独立,则(X,Y)服从二维正态分布,但题设并不知道X,Y是否独立,故B错误;
C.由A、B分析可知X与Y未必独立,故C正确;
D.需要求X与Y相互独立时,才能推出X+Y服从一维正态分布,故D错误.

 

18、若总体X~N(µ,δ^2),其中δ^2已知,当样本容量保持不变时,如果置信度减小,则的置信区间( ).

答:长度变小

* 我觉得变小,但是答案是不变

 

19、设随机变量X和Y的相关系数为0.5,E(X) = E(Y) = 0, E(X^2) = E(Y^2) = 0, 则E[(X +Y)^2] = ( ).

答:这应该是到错题。。。

 

20、某电灯泡生产商声称,它们生产的电灯泡的平均使用时间为85小时。质检部门抽取20个电灯泡的随机样本,在的显著性水平下,检验结果是未能拒绝原假设,这意味着()

答:没有证据证明该企业生产的电灯泡的平均使用时间不是85小时

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值