Andrew NG 机器学习课程笔记（三）

最新推荐文章于 2023-04-26 21:43:23 发布

大兔齐齐

最新推荐文章于 2023-04-26 21:43:23 发布

阅读量1.7k

点赞数

分类专栏：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Datuqiqi/article/details/45674541

版权

机器学习算法专栏收录该内容

15 篇文章 1 订阅

订阅专栏

本文介绍了机器学习中的欠拟合与过拟合概念，强调了模型选择的重要性。接着讲解了局部加权回归（LWR），包括其原理和优势，展示了其在预测中的优越性。最后提到了logistic回归，作为线性回归在分类问题上的应用，以及其最大似然估计和梯度上升法的使用。

摘要由CSDN通过智能技术生成

欠拟合与过拟合、局部加权回归、logistic回归

1.欠拟合与过拟合

当假设空间含有不同复杂度（例如，不同的参数个数）的模型时，就要面临模型选择的问题，我们希望选择或学习一个合适的模型。如果在假设空间中存在“真模型”，那么选择的模型应该逼近真模型。具体的，所选择的模型要与真模型的参数个数相同，所选择的模型的参数向量与真模型的参数向量相近。

如果一味的追求提高对训练数据的预测能力，所选模型的复杂度则往往会比真模型更高。这种现象称为过拟合。过拟合是指学习时选择的模型所包含的参数过多，以至于这一模型对已知数据预测的很好，但对未知数据预测很差的现象，可以说模型选择旨在避免过拟合并提高模型的预测能力。

下图给出了M=0，M=1，M=3，M=9时的拟合情况，M=0和1时模型过于简单，训练误差太大，明显的欠拟合，M=9时过于复杂，明显在训练数据中误差非常小，过拟合了

M=3模型复杂度适中，泛化能力强，效果最好

2.局部加权回归（不适合于大样本，计算量太大）

上面叙述的线性回归的算法说名特征的选择对学习算法的性能至关重要，那有没有自动选择特征集的算法，或者是让特征的选择对结果影响不那么大？这就是接下来介绍的LWR算法，局部加权线性回归。

在最初的线性回归算法中，对于输入变量X，我们要预测与之对应的Y，步骤如下：

相比而言，对于局部加权线性回归，步骤为：

这里多了一个权值项Wi，直观上来看，Wi的值越大，它所对应的残差对结果的影响越大，反之越小。Wi的计算表达式为：

其中xi是输入X附近的一个点。我们可以看到这个表达式类似于高斯分布，tao越大就代表了这个钟形曲线下降的越缓，tao越小，钟形曲线的下降速度就会越快。

从上图可以看到，离输入X越近的点，权值越接近于1；离X非常远的点，权值越接近于0。所以我们可以这样理解：在输入X附近构成了线性回归算法，对于Y的学习，主要依赖于X附近的点，如下图：

图中红色直线使用线性回归做的结果，黑色直线使用局部加权线性回归做的结果，可以看到局部加权效果较好。

LWR是NG的课程里面遇到的第一个非参数学习算法。所谓的参数学习算法就是它有固定的明确的参数，参数一旦确定，就不会改变了，我们不需要再保留训练集中的样本。而非参数学习算法，每进行一次预测，就要重新学习一组样本，参数是变化的。当样本比较大时，非参数的方法明显计算量就会很大，并且要花费很多空间去存储中间样本。

3.选用误差函数为平方和的概率解释：

假设根据特征的预测结果与实际结果有误差，那么预测结果和真实结果满足下式：

一般来讲，误差满足平均值为0的高斯分布，也就是正态分布。那么X和Y的条件概率也就是

这样就估计了一条样本的结果概率，然而我们期待的是模型能够在全部样本上预测最准，也就是概率最大。这个概率称为最大似然估计。

我们希望在最大似然估计得到最大值时确定theta，那么多对最大似然估计公式求导，求导结果既是

4.logistic回归

一般来说，回归不用在分类问题上，因为回归是连续模型，而且受噪声影响比较大，如果非要应用进入，可以使用logistic回归。

logistic回归本质上是线性回归，只是在特征到结果的映射中加入了一层函数映射，即先把特征线性求和，然后使用函数g(Z)作为假设函数。g(Z)可以将连续值映射到0和1上。

logistic回归的假设函数如下，线性回归假设函数只是thetaX

对数回归用来分类，也就是预测结果属于0或者1的二值分类问题，这里假设了二值满足伯努利分布，也就是

等价于

然后做最大似然估计

最大化上述函数可以用梯度上升法，参照于之前的提梯度下降法

所以：

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
4
评论
Andrew NG 机器学习课程笔记（三）

欠拟合与过拟合、局部加权回归、logistic回归 1.欠拟合与过拟合当假设空间含有不同复杂度（例如，不同的参数个数）的模型时，就要面临模型选择的问题，我们希望选择或学习一个合适的模型。如果在假设空间中存在“真模型”，那么选择的模型应该逼近真模型。具体的，所选择的模型要与真模型的参数个数相同，所选择的模型的参数向量与真模型的参数向量相近。如果一味的追求提高对训练数据的预测能力
复制链接

扫一扫

专栏目录

大兔齐齐 CSDN认证博客专家 CSDN认证企业博客

码龄9年

26: 原创

23万+: 周排名

32万+: 总排名

15万+: 访问

: 等级

1271: 积分

108: 粉丝

36: 获赞

16: 评论

105: 收藏

私信

关注

热门文章

分类专栏

最新评论

相对全面的SLURM集群的配置、安装及一些小问题的解决
风轻云淡这: 可以在conf文件中添加一下节点ip地址
相对全面的SLURM集群的配置、安装及一些小问题的解决
Doctor.Mr: 解决了吗？
相对全面的SLURM集群的配置、安装及一些小问题的解决
weixin_44843081: 大佬我今天在公司安装的时候遇到一个问题，大致是这样的，我配了两台一主一从，一个管理节点，一个计算节点，都配置的差不多了，用sinfo的测试的时候，它的状态开始显示为idel，但是过了1分钟左右，就会慢慢变成idel*，然后就变成down*，查看了日志，显示是连接从服务器ip和端口问题，报 ip:端口 not route to host的问题。但是我这两台都是做了相互的免密登录操作。然后时间也都同步过了。当然也相互ping的通，端口也都开放的。弄了半天也不知道是啥原因。能帮忙说下大致是啥原因吗
阿里天池大数据之移动推荐算法大赛总结及代码全公布
炸毛肉回复程序员龙湫: 请问您和您舍友的matlab程序还有吗？能不能给我发一份，救救这个刚入门推荐算法但是只会用matlab的小白吧，谢谢了！！shutinghhh@163.com ,打扰了！！
阿里天池大数据之移动推荐算法大赛总结及代码全公布
cccccererr: 您好，打扰了！请问能分享一下当时比赛的源数据吗？我们在进行建模比赛，希望能够用于模型研究，谢谢！我的邮箱是1265544209@qq.com

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

大兔齐齐 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。