网易雷火数据挖掘2019.9笔试题
(3道问答,1道编程(不限语言),2小时)
问答部分
第一题
- 树模型有哪些,异同点,使用场景
- 树模型的特征选择方法
- 设计广告推荐系统,采集哪些数据,提供什么特征,采用什么模型
第二题
统计前一天的新增账户的首日付费情况。
设计一种方案,计算第T+1天(即昨天)的离线统计情况
设计一种方案,计算T+0(即当天查询时刻)天的实时统计情况,延迟不超过1分钟
第三题
给了一大段关于mapreduce关于数据倾斜的英文
简要阐述文中解决数据倾斜的方案(需注明处于mapreduce的什么阶段)
给了用户id,还有别的什么,A类用户占90%,C类用户占极少,问可能存在的数据倾斜的问题以及解决方案
编程部分
三角形方位什么的
网易笔试总结:
考察传统机器学习方法,数据库,mapreduce数据倾斜问题
,设计广告推荐系统,编程能力。
招商银行信用卡中心IT数据研发方向2019.9
(16道单项选择,6道多项选择,3道编程,2小时)
- 单项选择
数据结构,java,机器学习,强化学习,概率题
- 多项选择
数据结构排序,rf和boosting,概率题,线性分类函数,java
- 编程(不限语言)
第一道是机器人向左向右转
第二道是字符串由0到9和?组成,?可用0-9数字代替,问哪些数字可以模13余5.
第三道没看
招商银行笔试总结:
考察【数据结构(重点)】,机器学习,强化学习,概率题,java, 编程