【算法岗面试系列】之机器学习

最新推荐文章于 2020-11-11 16:40:34 发布

haimianjie2012

最新推荐文章于 2020-11-11 16:40:34 发布

阅读量345

点赞数

分类专栏：算法机器学习面试题

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haimianjie2012/article/details/107376200

版权

算法机器学习面试题专栏收录该内容

11 篇文章 0 订阅

订阅专栏

目录

1. 写出全概率公式&贝叶斯公式

2. 模型训练为什么要引入偏差(bias)和方差(variance)？证

3. CRF/朴素贝叶斯/EM/最大熵模型/马尔科夫随机场/混合高斯模型

4. 如何解决过拟合问题？

5. One-hot的作用是什么？为什么不直接使用数字作为表示

6. 决策树和随机森林的区别是什么？

7. 朴素贝叶斯为什么“朴素naive”？

8. kmeans初始点除了随机选取之外的方法

9. LR明明是分类模型为什么叫回归

10. 梯度下降如何并行化

11. LR中的L1/L2正则项是啥

12. 简述决策树构建过程

13. 解释Gini系数

14. 决策树的优缺点

15. 出现估计概率值为 0 怎么处理

16. 随机森林的生成过程

17. 介绍一下Boosting的思想

18. gbdt的中的tree是什么tree？有什么特征

19. xgboost对比gbdt/boosting Tree有了哪些方向上的优化

20. 什么叫最优超平面

21. 什么是支持向量

22. SVM如何解决多分类问题

23. 核函数的作用是啥

1. 写出全概率公式&贝叶斯公式

2. 模型训练为什么要引入偏差(bias)和方差(variance)？证

机器学习中有两个主要的误差来源：偏差和方差。

假设你的算法在训练集上的错误率是15%，在开发集上的错误率是16%，那么这16%的错误率分两部分：

第一部分是算法在错误集上的错误率，本例子中为15%，我们叫算法的偏差；

第二部分是算法在开发集（或测试集）上的表现比训练集上差多少，本例子中开发集比训练集差1%，我们叫算法的方差。

如果你的算法表现如下：

训练集错误率=1%

开发集错误率 = 11%

虽然它的训练误差非常低（1%）,但是它有一个高方差（11%-1%），并没有成功地泛化到开发集上，发生了过拟合。

接下来，考虑另一种情况

训练集错误率=15%

开发集错误率=16%

此时偏差为15%，方差为1%，没有很好地拟合训练集，但训练集与开发集误差相近，我们称该算法是欠拟合的。

下面，再考虑如下情况:

训练集错误率 = 15%

开发集错误率 = 30%

偏差15%，方差15%，在训练集上表现的差，在开发集上表现的更差，该分类器同时存在欠拟合和过拟合。

最后考虑如下情况：

训练集错误率 =0.5%

开发集错误率 = 1%

该分类器效果很好，它具有低偏差和低方差，只有一个分类器同时存在低偏差和低方差时才会获得很好地性能。

机器学习中的偏差(bias)和方差(variance)

3. CRF/朴素贝叶斯/EM/最大熵模型/马尔科夫随机场/混合高斯模型

4. 如何解决过拟合问题？

5. One-hot的作用是什么？为什么不直接使用数字作为表示

6. 决策树和随机森林的区别是什么？

7. 朴素贝叶斯为什么“朴素naive”？

8. kmeans初始点除了随机选取之外的方法

9. LR明明是分类模型为什么叫回归

10. 梯度下降如何并行化

11. LR中的L1/L2正则项是啥

12. 简述决策树构建过程

13. 解释Gini系数

14. 决策树的优缺点

15. 出现估计概率值为 0 怎么处理

16. 随机森林的生成过程

17. 介绍一下Boosting的思想

18. gbdt的中的tree是什么tree？有什么特征

19. xgboost对比gbdt/boosting Tree有了哪些方向上的优化

20. 什么叫最优超平面

21. 什么是支持向量

22. SVM如何解决多分类问题

23. 核函数的作用是啥

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
【算法岗面试系列】之机器学习

目录1. 写出全概率公式&贝叶斯公式2. 模型训练为什么要引入偏差(bias)和方差(variance)？证3. CRF/朴素贝叶斯/EM/最大熵模型/马尔科夫随机场/混合高斯模型4. 如何解决过拟合问题？5. One-hot的作用是什么？为什么不直接使用数字作为表示6. 决策树和随机森林的区别是什么？7. 朴素贝叶斯为什么“朴素naive”？8. kmeans初始点除了随机选取之外的方法9. LR明明是分类模型为什么叫回归10. 梯度下降如何并行化.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

haimianjie2012 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。