数据挖掘面试总结

第一家公司

自我介绍

问题一:面试官介绍了一下公司的业务,然后问根据业务的数据维度应该选择什么样的算法模型进行建模会比较好?

问题二:集成算法都有哪些?xgboost在这些算法里面有什么优缺点?

问题三:xgboost需要做哪些方面的数据预处理?

问题四:xgboost的优化函数有哪些?每个优化函数的特点是什么?

问题五:xgboost在你的项目里面你们是怎么做的参数调优?

问题六:我看你的项目里面用到了xgboost,你能讲一下你的项目里面你是怎么筛选数据、清理数据、怎么选择特征的吗?

问题七:最后你用了多少特征、多少的数据集进行建模的?

问题八:你是几个人参与的这个项目?是你一个人吗?你主要负责什么?你们是怎么分工的呢?

问题九:程序的工程代码是谁写的呢?你参与没有?是做算法的来做工程还是有专门的人来写工程?

问题十:除了结构化的机器学习,其他的深度学习有没有了解?

问题十一:数据分布常见的有哪些分布?二项分布是什么意思?

问题十二:Python技能是就数据分析、机器学习这一块吗?其他方面的呢?

问题十三:问个SQL的问题,查每个班级数学成绩第一名的姓名和分数

select 
    name,
    score
from 
    (select
        name,
        math,
        row_number() over(partiton by class order by math desc) as ranking
     from 
        stu) as t
where
    ranking = 1 

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值