机器学习之正则化

最新推荐文章于 2020-05-24 20:18:11 发布

bytes9

最新推荐文章于 2020-05-24 20:18:11 发布

阅读量121

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/bytes9/article/details/89948010

版权

机器学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

1.为什么要正则化?

防止过拟合.

2.什么是过拟合?

指训练的模型在训练集的损失很小,但是在测试集上表现不佳.

3.为什么会过拟合?

一般来说,数据中会有噪声,为了拟合包含噪声的训练集的数据,模型会变得很复杂.而这个模型只是适合这个包含了噪声的训练集,和实际的模型有较大偏差,在测试集数据上往往表现不回.

4.什么是正则化,其思想是什么?

正则化的思想是,模型应当是趋于简单的.根据奥卡姆剃刀定律，或许我们可以通过降低复杂模型的复杂度来防止过拟合，这种原则称为正则化,以最小化损失和复杂度为目标，这称为结构风险最小化.

5.模型复杂度怎么度量?

如果模型复杂度是权重的函数，则特征权重的绝对值越高，对模型复杂度的贡献就越大。我们可以使用

L2 正则化公式来量化复杂度，该公式将正则化项定义为所有特征权重的平方和：接近于 0 的权重对模型复杂度几乎没有影响，而离群值权重则可能会产生巨大的影响。

L1正则化公根据权重的绝对值的总和来惩罚权重。在依赖稀疏特征的模型中，L1 正则化有助于使不相关或几乎不相关的特征的权重正好为 0，从而将这些特征从模型中移除。与 L2 正则化相对。

6.L1,L2如何选择?

L₁ 正则化, 又称稀疏性正则化 (Regularization for Sparsity) ,可用于特征选择,大量权重为零的特征被排除,选择少量权重不为零的特征.

在线性模型中，L2 正则化始终可以改进泛化

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习之正则化

1.为什么要正则化?防止过拟合.2.什么是过拟合?指训练的模型在训练集的损失很小,但是在测试集上表现不佳.3.为什么会过拟合?一般来说,数据中会有噪声,为了拟合包含噪声的训练集的数据,模型会变得很复杂.而这个模型只是适合这个包含了噪声的训练集,和实际的模型有较大偏差,在测试集数据上往往表现不回.4.什么是正则化,其思想是什么?正则化的思想是,模型应当是趋于简单的.根据奥...
复制链接

扫一扫

专栏目录

bytes9 CSDN认证博客专家 CSDN认证企业博客

码龄16年

45: 原创

19万+: 周排名

6万+: 总排名

3万+: 访问

: 等级

653: 积分

6: 粉丝

18: 获赞

5: 评论

49: 收藏

私信

关注

热门文章

分类专栏

css 2篇
spring 8篇
javascript 1篇
前端 1篇
Java
版本控制工具 1篇
算法 3篇
opencv
python 9篇
机器学习 10篇
tensorflow 6篇

最新评论

gibbs采样算法的理解
不正经的kimol君: 写的不错，学习了，学习的道路上一起进步，也期待你的关注与支持！
tensorflow为何采用图（Graph）方式之我的理解
bytes9: tensorflow官网有
tensorflow为何采用图（Graph）方式之我的理解
qq_41723498: 动态图出处能给个引用吗
python 笔记
bytes9: 使用单下划线(_one_underline)开头表示方法不是API的一部分，不要直接访问（虽然语法上访问也没有什么问题）。使用双下划线开头(__two_underlines)开头表示子类不能覆写该方法。除非你真的知道你在干什么，否则不要使用这种方式。当你想让自己定义的对象也可以像Python内置的对象一样使用Python内置的一些函数或操作符（比如len、add、+、-、==等）时，你可以定义该类方法。当然还有些属性只在末尾加了但下划线，这仅仅是为了避免我们起的一些名字和Python保留关键字冲突，没有特殊含义。
python 笔记
bytes9: 单下划线开头我们经常看到方法或者属性前面加了单下划线，并认为它表示该方法或者属性是该类型（Python和Golang一样，不光类可以有方法，很多类型甚至基本类型也可以定义方法）的私有方法或属性。但其实在Python中不存在真正意义上的私有方法或者属性，前面加单下划线_只是表示你不应该去访问这个方法或者属性，因为它不是API的一部分。双下划线开头之前很多人跟我说Python中双下划线开头表示私有，我在很多地方也见到这样的说法。这样理解可能也不能说错，但这不是Python设计双下划线开头的初衷和目的，Python设计此的真正目的仅仅是为了避免子类覆盖父类的方法。开头结尾双下划线一般来说像__this__这种开头结尾都加双下划线的方法表示这是Python自己调用的，你不要调用。比如我们可以调用len()函数来求长度，其实它后台是调用了__len__()方法。一般我们应该使用len，而不是直接使用__len__(): 我们一般称__len__()这种方法为magic methods，一些操作符后台调用的也是也是这些magic methods

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。