第一家公司
自我介绍
问题一:面试官介绍了一下公司的业务,然后问根据业务的数据维度应该选择什么样的算法模型进行建模会比较好?
问题二:集成算法都有哪些?xgboost在这些算法里面有什么优缺点?
问题三:xgboost需要做哪些方面的数据预处理?
问题四:xgboost的优化函数有哪些?每个优化函数的特点是什么?
问题五:xgboost在你的项目里面你们是怎么做的参数调优?
问题六:我看你的项目里面用到了xgboost,你能讲一下你的项目里面你是怎么筛选数据、清理数据、怎么选择特征的吗?
问题七:最后你用了多少特征、多少的数据集进行建模的?
问题八:你是几个人参与的这个项目?是你一个人吗?你主要负责什么?你们是怎么分工的呢?
问题九:程序的工程代码是谁写的呢?你参与没有?是做算法的来做工程还是有专门的人来写工程?
问题十:除了结构化的机器学习,其他的深度学习有没有了解?
问题十一:数据分布常见的有哪些分布?二项分布是什么意思?
问题十二:Python技能是就数据分析、机器学习这一块吗?其他方面的呢?
问题十三:问个SQL的问题,查每个班级数学成绩第一名的姓名和分数
select
name,
score
from
(select
name,
math,
row_number() over(partiton by class order by math desc) as ranking
from
stu) as t
where
ranking = 1