机器学习面试浅谈

最新推荐文章于 2019-12-25 14:42:57 发布

Fuxy_0624

最新推荐文章于 2019-12-25 14:42:57 发布

阅读量361

点赞数 1

分类专栏：机器学习；面试文章标签：机器学习面试数据分析经验工作

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Fuxy_0624/article/details/78209112

版权

本文是作者在机器学习面试前的复习总结，包括数据处理、特征转换、特征选择、正则化和模型评估等方面的知识。面试中，作者意识到业务理解和问题解决能力同样重要，分享了对传统模型如LR和树模型的理解，以及如何应对数据不均衡等问题。

摘要由CSDN通过智能技术生成

前几天接到心仪公司的机器学习面试邀请，由于之前一直做数据分析，并没有太多机器学习实战经验，深知不足，于是开始了两天没日没夜的‘考前突击’，总结了很多自认为有用的东西；出乎意料的是面试全程并未问到专业知识，大多是从平时做的工作中挖掘我的态度及能力。不论结果如何，这是我反思最多的一次面试，有些看似不起眼的问题也许正潜伏着最大的机会。感想不多说，趁自己还有激情，把这两天突击的东西记下总结起来，方便以后复习，也激励自己更深入的学习。其中有一些没有得到答案的，欢迎大神指点。（这是本人第一次写博客，也算行业新人，如有错误，欢迎各位看官指正讨论）

一. 模型前的准备

1. 数据处理：如何处理缺失数据？各种方法的利弊？

a. 分析缺失比例决定是否移除; 不能确定移除的数据的价值，可能会除掉有用数据，导致模型欠拟合。

b. 用均值，众数，回归代替；对于正常数据分布的样本可以使用均值代替，有倾斜的数据样本可以使用中位数代替。

c. 用特殊值（如0）代替；方法简单，并不可靠。

d. 用模型预测结果填充，如决策树；较可靠，适用于缺失值个数较少样本多情况，较麻烦

2. 如何将描述变量转为连续变量？

one-hot编码（红：1，0，0；绿：0，1，0；蓝：0，0，1）

3. 如何处理有序变量和无序变量？

有序

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习面试浅谈

前几天接到心仪公司的机器学习面试邀请，由于之前一直做数据分析，并没有太多机器学习实战经验，深知不足，于是开始了两天没日没夜的‘考前突击’，总结了很多自认为有用的东西；出乎意料的是面试全程并未问到专业知识，大多是从平时做的工作中挖掘我的态度及能力。不论结果如何，这是我反思最多的一次面试，有些看似不起眼的问题也许正潜伏着最大的机会。感想不多说，趁自己还有激情，把这两天突击的东西记下总结起来，方便以后复...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。