《机器学习实战学习笔记》（七）：训练模型练习题

最新推荐文章于 2023-03-26 19:53:59 发布

闹闹的BaBa

最新推荐文章于 2023-03-26 19:53:59 发布

阅读量1.5k

点赞数

分类专栏：机器学习文章标签：训练模型练习题机器学习面试机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012415035/article/details/102868399

版权

机器学习专栏收录该内容

23 篇文章 11 订阅

订阅专栏

1. 如果训练集特征超过百万个，你会选择什么线性回归训练算法？

随机梯度下降或小批量梯度下降，内存允许的话也可以用批量梯度下降。由于计算复杂度随着特征数量的增加而加速提升(比二次方高)，所以不能使用标准方程。

2.如果训练集里特征的数值大小迥异，什么算法可能会受到影响？受影响程度如何？你该怎么做？

成本函数呈现为细长的碗状，导致梯度下降算法震荡耗费很长时间才能收敛。解决：数据缩放。

3.训练逻辑回归模型时，梯度下降是否会困于局部最小值？

逻辑回归的成本函数是凸函数，所以不会，否则会。

4.假设运行时间足够长，所有的梯度下降算法是不是最终会产生相同的模型?

如果优化问题是凸的（比如线性回归或逻辑回归），且学习率不搞，那么所有梯度下降算法都可以接近全局最优，`生成的模型都非常相似？为什么呢？？？`。即使运行时间足够长，也会有轻微不同。

5.假设你使用的是批量梯度下降，并且每一轮训练都绘制出其验证误差，如果发现验证误差持续上升，可能发生了什么？如何解决？

如果验证误差开始每轮上升，可能学习率太高。如果训练误差也开始上升，显示是算法开始发散，需要降低学习率。但是，如果训练误差不上升，验证误差上升（两条线间间隙变大），过拟合。

6.当验证误差开始上升时，立刻停止小批量梯度下降算法训练是否是一个好主意？

不能，无论是SGD还是小批量梯度下降，由于随机性，不能保证每一轮迭代取得最优。解决方法：`定时保存最优模型，当较长一段时间没有改善时，恢复到最优模型。`

7.哪种梯度下降算法能最快到达最优解附近？哪种会收敛？如何使用其他算法同样收敛？

随机梯度下降的迭代训练最快，因为一次只考虑一个训练实例。只有批量梯度下降才会真正收敛。随机梯度下降和小批量梯度下降，将会一直围绕最小值上上下下，除非降低学习率。

8.假设您使用的是`多项式回归`，绘制出学习曲线，你发现训练误差和验证误差之间存在很大的差距，发送了什么？哪三种方法可以解决这个问题？

训练集上表现好，验证集上表现差，过拟合。解决方法：多项式降阶 (降低模型复杂度)、增加正则项、扩大训练集。

9.假设你使用的是岭回归，你注意到训练误差和验证误差几乎相等，并且非常高。你认为模型是高方差还是高偏差？你应该提高还是降低正则化超参数 $\alpha$ ？

高偏差，降低

10.你为何要使用：

岭回归而不是线性回归？因为正则项使模型泛化能力更好。

lasso回归而不是岭回归？ lasso使用l1惩罚函数，倾向于将无用特征权重置为0，生成一个稀疏模型。

弹性网络而不是lasso回归？因为特征相关性强或特征数量比实例数量还多时，lasso非常不稳定。另外，弹性网络会添加一个额外的超参数r对模型进行调整，可自由切换岭回归和lasso回归。

11.如果你想将图片分类为户外/室内以及白天/黑夜。你应该实现两个逻辑回归分类器还是一个Softmax回归分类器？

2个逻辑回归分类器，因为不是互斥的。

12.用Softmax回归进行批量梯度下降训练，并实施早期停止法(不使用sklearn)。

略。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
《机器学习实战学习笔记》（七）：训练模型练习题

1. 如果训练集特征超过百万个，你会选择什么线性回归训练算法？随机梯度下降或小批量梯度下降，内存允许的话也可以用批量梯度下降。由于计算复杂度随着特征数量的增加而加速提升(比二次方高)，所以不能使用标准方程。2.如果训练集里特征的数值大小迥异，什么算法可能会受到影响？受影响程度如何？你该怎么做？成本函数呈现为细长的碗状，导致梯度下降算法震荡耗费很长时间才能收敛。解决：数据缩放。...
复制链接

扫一扫

专栏目录

闹闹的BaBa CSDN认证博客专家 CSDN认证企业博客

码龄11年

100: 原创

2万+: 周排名

130万+: 总排名

22万+: 访问

: 等级

3051: 积分

1916: 粉丝

170: 获赞

58: 评论

813: 收藏

私信

关注

分类专栏

最新评论

自然语言处理（NLP）算法分类总结
CSDN-Ada助手: 什么是自然语言处理？
impala日期函数全集
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)文章不宜太短；(2)增加除了各种控件外，文章正文的字数；(3)增加条理清晰的目录。
通俗理解逻辑回归
CSDN-Ada助手: 很多人说算法库都是现成的，没必要掌握算法了，你怎么看呢？
top命令输出解释以及load average 详解及排查思路
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(2)使用更多的站内链接；(3)增加条理清晰的目录。
大数据平台搭建（二）：hadoop HA 集群搭建
CSDN-Ada助手: Apache Arrow 这种列式内存格式，它的优势是什么？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。