算法面试必备-----贝壳算法面试准备

最新推荐文章于 2024-08-07 08:43:26 发布

Avery123123

最新推荐文章于 2024-08-07 08:43:26 发布

阅读量952

点赞数

分类专栏：算法岗面试笔试准备

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/avery123123/article/details/107957967

版权

算法面试必备-----贝壳算法面试准备

算法面试必备-----贝壳算法面试准备
- 机器学习基础

算法面试必备-----贝壳算法面试准备

机器学习基础

1、过拟合和欠拟合的学习曲线怎么画，横纵坐标轴分别代表什么？实际应用当中，如何区分你是过拟合还是前拟合？

学习曲线是什么？

学习曲线就是通过画出不同训练集大小时训练集和交叉验证的准确率，可以看到模型在新数据上的表现，进而来判断模型是否方差偏高或偏差过高，以及增大训练集是否可以减小过拟合。

学习曲线与交叉验证的关系

由于一次学习的数据不够准确，因此，使用交叉验证，设置多次(组)数据，获得多组train_scores, test_scores, 返回给learning_curve API。

怎么画？

在画学习曲线时，横轴为训练样本的数量，纵轴为准确率。

sklearn中sklearn.model_selection.learning_curve函数说明：

通过cv设置交叉验证，取几次(组)数据，通过train_sizes设置每一次取值，在不同训练集大小上计算得分。

train_sizes，train_scores，test_score = learning_curve ( estimator, X, y, groups=None, train_sizes=array([0.1, 0.33, 0.55, 0.78, 1. ]), cv=’warn’, scoring=None)

estimator：估计器，用什么模型进行学习；

cv:交叉验证生成器，确定交叉验证拆分策略；

画训练集的曲线时，横轴为train_sizes, 纵轴为train_scores_mean; train_scores为二维数组,行代表train_sizes不同时的得分，列表示取cv组数据。

画测试集的曲线时：横轴为train_sizes, 纵轴为test_scores_mean; test_scores为二维数组

learning_curve为什么运行时间那么长：模型要进行train_sizes * cv次运行

如何判断？

在这里插入图片描述
欠拟合情况：随着训练样本数增大，训练集得分和验证集得分收敛，并且两者的收敛值很接近。

过拟合情况：随着训练样本数增大，训练集得分和验证集得分相差还是很大。

欠拟合
当训练集和测试集的误差收敛但却很高时，为高偏差。

左上角的偏差很高，训练集和验证集的准确率都很低，很可能是欠拟合。
我们可以增加模型参数，比如，构建更多的特征，减小正则项。
此时通过增加数据量是不起作用的。

过拟合
当训练集和测试集的误差之间有大的差距时，为高方差。

当训练集的准确率比其他独立数据集上的测试结果的准确率要高时，一般都是过拟合。
右上角方差很高，训练集和验证集的准确率相差太多，应该是过拟合。
我们可以增大训练集，降低模型复杂度，增大正则项，或者通过特征选择减少特征数。

理想情况
理想情况是是找到偏差和方差都很小的情况，即收敛且误差较小。

2、对于不平衡数据集，有什么应对方案？

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
算法面试必备-----贝壳算法面试准备

算法面试必备-----贝壳算法面试准备算法面试必备-----贝壳算法面试准备机器学习基础1、过拟合和欠拟合的学习曲线怎么画，横纵坐标轴分别代表什么？实际应用当中，如何区分你是过拟合还是前拟合？学习曲线是什么？学习曲线与交叉验证的关系怎么画？如何判断？2. 对于不平衡数据集，有什么应对方案？3、数据集不平衡时采用评价指标呢？评估指标1：recall，Precision，F-score评估指标2：ROC（接受者操作特征曲线）与AUC简述 ROC 曲线统计量的含义？如何画出一个 ROC 曲线？简述 AUC 曲线统
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。