机器学习面试浅谈

本文是作者在机器学习面试前的复习总结,包括数据处理、特征转换、特征选择、正则化和模型评估等方面的知识。面试中,作者意识到业务理解和问题解决能力同样重要,分享了对传统模型如LR和树模型的理解,以及如何应对数据不均衡等问题。
摘要由CSDN通过智能技术生成

前几天接到心仪公司的机器学习面试邀请,由于之前一直做数据分析,并没有太多机器学习实战经验,深知不足,于是开始了两天没日没夜的‘考前突击’,总结了很多自认为有用的东西;出乎意料的是面试全程并未问到专业知识,大多是从平时做的工作中挖掘我的态度及能力。不论结果如何,这是我反思最多的一次面试,有些看似不起眼的问题也许正潜伏着最大的机会。感想不多说,趁自己还有激情,把这两天突击的东西记下总结起来,方便以后复习,也激励自己更深入的学习。其中有一些没有得到答案的,欢迎大神指点。(这是本人第一次写博客,也算行业新人,如有错误,欢迎各位看官指正讨论)

一. 模型前的准备

1. 数据处理:如何处理缺失数据?各种方法的利弊?

a. 分析缺失比例决定是否移除;  不能确定移除的数据的价值,可能会除掉有用数据,导致模型欠拟合。

b. 用均值,众数,回归代替;对于正常数据分布的样本可以使用均值代替,有倾斜的数据样本可以使用中位数代替。

c. 用特殊值(如0)代替; 方法简单,并不可靠。

d. 用模型预测结果填充,如决策树;较可靠,适用于缺失值个数较少样本多情况,较麻烦

2. 如何将描述变量转为连续变量?

 one-hot编码(红:1,0,0;绿:0,1,0;蓝:0,0,1)

3. 如何处理有序变量和无序变量?

有序

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值