Machine Learning 课程笔记6：机器学习应用指导

最新推荐文章于 2019-11-05 09:01:46 发布

Sherryllll

最新推荐文章于 2019-11-05 09:01:46 发布

阅读量1.2k

点赞数

分类专栏： Machine Learning

本文链接：https://blog.csdn.net/sherrylml/article/details/40949677

版权

本文介绍了在机器学习过程中遇到问题时的解决策略。当线性回归模型预测房价有较大误差，可以尝试获取更多或更少的特征，调整归一化程度，或者使用交叉验证。通过训练集和测试集评估假设，避免过拟合。学习曲线用于识别高偏差或高方差问题，帮助选择优化方法。增加训练样本可以解决高方差，减少特征数量或增加二项式特征则有助于降低偏差。

摘要由CSDN通过智能技术生成

1、决定下一步做什么

假设我们需要用一个线性回归模型来预测房价，然而，当我们用这个模型来预测新数据时发现有较大的误差，那么我们下一步应该怎么做？

获得跟多的训练示例——代价较大，而且有时候获得更多示例does not help

尝试减少特征数量——防止过拟合

尝试获得更多特征量

尝试增加二项式特征

尝试减少归一化程度——减小lambda

尝试增加归一化程度——增大lambda

我们需要使用一些机器学习诊断方法来帮助我们找到机器学习算法的问题以及那种解决方法更有效

2、假设的评估

如何判断有没有过拟合？

很多情况下特征量很多，无法画出曲线图来判断，如下给出了一种评估假设的标准方法：

将数据分成两部分——训练集合测试集。通常用70%的数据作为训练集，剩下为测试集。

注：注意训练集和数据集均要包含各种类型的数据，通常我们要对数据进行混合打乱后在分成两部分。

测试集评估：

通过训练集让我们的模型学习处参数后，对测试集运用该模型，计算误差：

1.对于现行模型，我们利用测试集数据计算大家函数J

2.对于逻辑回归模型，我们除了可以用公式Ｊ来计算外：