【超详细】数据分析笔试题分享,32岁的程序员被裁


又到了笔试题分享环节,今天的数据分析笔试题来自于迅雷网络,尽管你不打算投这家公司,也完全可以仔细做一遍题,增长一下笔试经验。

另外,对于第二大题,有想法的朋友也可以和我交流。

目录

一、21道不定项选择题

1、 以下选项不正确的是() A,B,D
A、使用drop会释放空间
B、Truncate可以搭配where使用
C、alter…drop… 可用于除去表中字段
D、Delete会释放空间

解析:

A项,drop后的表被放在回收站(user_recyclebin)里,而不是直接删除掉。这样,回收站里的表信息就可以被恢复,或彻底清除,若要彻底删除表,则使用语句:drop table <table_name> purge;
B项D项,truncate 删除表同时释放表空间,不能加where条件,delete只是删除记录,不释放表空间;
C项,alter table [表名] drop column [列名]用于除去表中特定字段。

2、以下常用于衡量用户粘性的指标有哪些() A,B,D
A、DAU
B、Usage Penetration
C、Revenue
D、Retention

解析:

A项,DAU,日活跃用户数量;
B项,Usage Penetration,使用行为渗透率,一段时间内使用该应用的用户百分比;
C项,Revenue,收入;
D项,Retention,用户留存。

3、一年四个季度,第二到第四个季度对于上个季度的销售额增长率分别为5%、10%、15%,请问第四个季度相对于第一季度的增长率约为() D
A、50%
B、80%
C、30%
D、33%

解析:

1.05

1.10

1.15

=

1.32825

1.05 * 1.10 * 1.15=1.32825

1.05∗1.10∗1.15=1.32825

4、有两个拥有完全相同字段的表,其中一个有10行数据,另一个有5行数据,以下结论不正确的是() A
A、使用left join连接后的表的数据一定不超过10行
B、使用left join连接后的表的数据可能为10行
C、使用left join连接后的表的数据可能超出10行
D、使用left join连接后的表的数据可能小于10行

解析:

Left Join 连接后的表的数据量可能大于小于或等于左表的数据量。
当where 条件在外,会先聚合后过滤,结果会变少;连接的判断条件也可能使左表的一行数据连接的数据超过一行,结果会变多。

5、以下算法哪些属于聚类算法() A, B, D
A、DBSCAN
B、EM
C、KNN
D、K-means

解析:

KNN算法属于分类算法。

6、有关hive内部表和外部表与元数据之间的关系的题,具体也忘了。

7、下列有关欠采样的说法,不正确的有() A,B
A、欠采样是通过增加少数类的数据来达到平衡的效果
B、神经网络算法对于不平衡数据并不敏感
C、欠采样可以用于平衡数据(这个我也忘记了)
D、欠采样是通过减少多数类的数据来达到平衡的效果,可能导致过拟合的情况

8、忘了题目的数据,但主要就是考察你是否认识以下指标。

LT, 用户生命周期, 是用户自激活开始至最后一次活跃期间的活跃天数
LTV,用户生命周期价值,是产品从用户获取到流失所得到的全部收益的总和。
ROI,投资回报率,是指通过投资而应该返回的价值,即企业从某项投资行为中得到的经济利益回报。
ARPU,计算公式为:ARPU 值=总收入 / 用户数
ARPPU,平均每付费用户收益

9、下列哪些方法可用于缺失值的处理() A,B,C,D
A、均值填充
B、高维映射
C、建模预测
D、删除缺失数据

解析:

B项,将属性映射到高维空间,采用独热码编码(one-hot)技术。将包含K个离散取值范围的属性值扩展为K+1个属性值,若该属性值缺失,则扩展后的第K+1个属性值置为1。这种做法是最精确的做法,保留了所有的信息,也未添加任何额外信息,若预处理时把所有的变量都这样处理,会大大增加数据的维度。这样做的好处是完整保留了原始数据的全部信息、不用考虑缺失值;缺点是计算量大大提升,且只有在样本量非常大的时候效果才好。

10、以下哪些方法不属于过滤式特征选择() C
A、相关系数法
B、卡方检验
C、PCA
D、方差选择

解析:

A项,使用pearson系数作为特征评分标准,相关系数绝对值越大,相关性越强(相关系数越接近于1或-1时,相关性越强;相关系数越接近于0时,相关性越弱)。特点:皮尔森相关系数法能够衡量线性相关的特征集;
B项, 使用统计量卡方检验作为特征评分标准,卡方检验值越大,相关性越强(卡方检验是评价定性自变量对定性因变量相关性的统计量);
D项,使用方差作为特征评分标准,如果某个特征的取值差异不大,通常认为该特征对区分样本的贡献度不大,因此在构造特征过程中去掉方差小于阈值的特征。

11、问以下哪种情况可能会提高GMV() A,B,C,D
A、商品涨价
B、商品降价
C、日活量提高
D、新用户增多

解析:

GMV指标通常称为网站成交金额,属于电商平台企业成交类指标。

12、以下哪种方法无法定义出dict类型的数据() B
A、d = {123: ‘abc’}
B、d = {[123]: ‘abc’}
C、d = {(1,2,3): ‘abc’}
D、d = {}

解析:

python中字典的key不能是可变类型。字典可存储任意类型对象,其中值可以取任何数据类型,但键必须是不可变的,如字符串、数字或元组。
所以B项不可以,而D项也是可以的,大家不信可以自己去定义一个然后type一下。

13、以下关于原假设

H

0

H_0

H0​和备择假设

H

1

H_1

H1​的说法,不正确的是() C,D
A、

H

1

H_1

H1​通常是支持结论
B、

H

0

H_0

H0​和

H

1

H_1

H1​是相互对立的
C、假设检验前,先确定备择假设
D、

H

0

H_0

H0​也称对立假设

解析:

A项我也没懂啥意思(如果意思

H

1

自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。

深知大多数Linux运维工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!

因此收集整理了一份《2024年Linux运维全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
img
img
img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上Linux运维知识点,真正体系化!

由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新

如果你觉得这些内容对你有帮助,可以添加VX:vip1024b (备注Linux运维获取)
img

为了做好运维面试路上的助攻手,特整理了上百道 【运维技术栈面试题集锦】 ,让你面试不慌心不跳,高薪offer怀里抱!

这次整理的面试题,小到shell、MySQL,大到K8s等云原生技术栈,不仅适合运维新人入行面试需要,还适用于想提升进阶跳槽加薪的运维朋友。

本份面试集锦涵盖了

  • 174 道运维工程师面试题
  • 128道k8s面试题
  • 108道shell脚本面试题
  • 200道Linux面试题
  • 51道docker面试题
  • 35道Jenkis面试题
  • 78道MongoDB面试题
  • 17道ansible面试题
  • 60道dubbo面试题
  • 53道kafka面试
  • 18道mysql面试题
  • 40道nginx面试题
  • 77道redis面试题
  • 28道zookeeper

总计 1000+ 道面试题, 内容 又全含金量又高

  • 174道运维工程师面试题

1、什么是运维?

2、在工作中,运维人员经常需要跟运营人员打交道,请问运营人员是做什么工作的?

3、现在给你三百台服务器,你怎么对他们进行管理?

4、简述raid0 raid1raid5二种工作模式的工作原理及特点

5、LVS、Nginx、HAproxy有什么区别?工作中你怎么选择?

6、Squid、Varinsh和Nginx有什么区别,工作中你怎么选择?

7、Tomcat和Resin有什么区别,工作中你怎么选择?

8、什么是中间件?什么是jdk?

9、讲述一下Tomcat8005、8009、8080三个端口的含义?

10、什么叫CDN?

11、什么叫网站灰度发布?

12、简述DNS进行域名解析的过程?

13、RabbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?

17、如何重置mysql root密码?

一个人可以走的很快,但一群人才能走的更远。如果你从事以下工作或对以下感兴趣,欢迎戳这里加入程序员的圈子,让我们一起学习成长!

AI人工智能、Android移动开发、AIGC大模型、C C#、Go语言、Java、Linux运维、云计算、MySQL、PMP、网络安全、Python爬虫、UE5、UI设计、Unity3D、Web前端开发、产品经理、车载开发、大数据、鸿蒙、计算机网络、嵌入式物联网、软件测试、数据结构与算法、音视频开发、Flutter、IOS开发、PHP开发、.NET、安卓逆向、云计算

abbitMQ是什么东西?

14、讲一下Keepalived的工作原理?

15、讲述一下LVS三种模式的工作过程?

16、mysql的innodb如何定位锁问题,mysql如何减少主从复制延迟?

17、如何重置mysql root密码?

一个人可以走的很快,但一群人才能走的更远。如果你从事以下工作或对以下感兴趣,欢迎戳这里加入程序员的圈子,让我们一起学习成长!

AI人工智能、Android移动开发、AIGC大模型、C C#、Go语言、Java、Linux运维、云计算、MySQL、PMP、网络安全、Python爬虫、UE5、UI设计、Unity3D、Web前端开发、产品经理、车载开发、大数据、鸿蒙、计算机网络、嵌入式物联网、软件测试、数据结构与算法、音视频开发、Flutter、IOS开发、PHP开发、.NET、安卓逆向、云计算

  • 17
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值