正则化

最新推荐文章于 2021-09-16 10:30:30 发布

快剑青衣

最新推荐文章于 2021-09-16 10:30:30 发布

阅读量249

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011070767/article/details/80572937

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

过拟合：

我们使用太多的变量去学习一个过度复杂的模型，此模型过度配合训练数据，几乎完全适合(或者完全适合)所有训练数据（损失函数几乎为0），导致不能泛化的预测实际数据

如下图：

例子如下：

还有一种情况就是使用太多的特征，然后数据却不是远大于特征数，那么也会产生过拟合，解决办法如下：

1、减小模型复杂度

选主要的特征保留，去掉高的多项式（减少模型复杂度）

去掉的特征有可能也会少部分影响预测

2、正则化：

保留所有的特征，但是减少某些的参数的值

正则化：

目的：让高项式和相关度低的特征的参数变的尽可能小，以使模型更平滑更简单，让模型不易于过拟合

实际上我们会加上公式（后面图中有）让所有参数都减少

如下图：对高的多项式让其参数尽量的小，这样就高的多项式的影响就会微乎其微但是又能保留其一些影响力，会让预测效果更好

通过在代价函数后面，加上对应参数的高多项式来实现（如下图）

这样就既能让所有特征和高多项式保留，又能减少过拟合

下面粉红色的部分就是正则式，前面的符号是正则化参数，

因为训练中我们不知道哪个高项式才算特别高得减少，哪个特征相关度低要减少，所以我们会对除了0之外的所有参数都进行减少（一般不包括第0个参数，不过如果加上对结果影响也不大）如下图的公式；

这样训练出来的模型更简单，很难过拟合

如果正则化参数设置过大，除第0个参数，其他参数的惩罚度都是很大，模型相当于一个直线，欠拟合，所以设置合适的正则化参数很重要

之前说过如果特证数大于样本数，那么X的倒置和X的内积是不可逆的，但是应用正则化之后，下图括号中的式子却是可逆的，让线性回归更难过拟合

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

快剑青衣 CSDN认证博客专家 CSDN认证企业博客

码龄11年

16: 原创

41万+: 周排名

103万+: 总排名

1万+: 访问

: 等级

341: 积分

10: 粉丝

7: 获赞

2: 评论

0: 收藏

私信

关注

热门文章

分类专栏

最新评论

R-CNN
qq_41895190: "D:\Program Files\Python365\python.exe" G:/Tensorflow/ChinesePlateRecognition-master/lib/model/train_val.py Traceback (most recent call last): File "G:/Tensorflow/ChinesePlateRecognition-master/lib/model/train_val.py", line 10, in <module> from model.config import cfg ModuleNotFoundError: No module named 'model'
R-CNN
qq_41895190: 楼主您好，下载了您 ChinesePlateRecognition 这个项目的源码，想运行一下，我是win10 系统，好像跑不起来,您qq多少，方便加qq咨询一下吗？谢谢 QQ2737499951

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。