正则化和归一化

最新推荐文章于 2022-12-09 20:40:56 发布

编程初丁

最新推荐文章于 2022-12-09 20:40:56 发布

阅读量2.2k

点赞数 2

分类专栏：机器学习算法学习笔记

机器学习算法学习笔记专栏收录该内容

4 篇文章 0 订阅

订阅专栏

正则化，归一化（标准化和正规化）：对数据进行预处理的两种方式，目的是让数据更便于计算和获得更加泛化的结果，但并不改变问题的本质。

正则化：要求一个逻辑回归问题，假设一个函数，覆盖所有可能：y=wx，其中w为参数向量，x为已知样本的向量，用yi表示第i个样本的真实值，用f(xi)表示样本的预测值，从而确定损失函数L(yi,f(xi))=yi−sigmoid(xi)。该损失函数代表一种误差。对于该模型y=wx的所有样本的损失平均值，我们称为经验损失（empirical loss）。

　　显然，经验损失（或称经验风险）最小化（empirical risk minimization）就是求解最优模型的原则。为了达到这个目的，模型的设定会越来越复杂，最后可能造成模型只适用于当前的样本集，即出现过拟合（over fitting）问题。

　　为了解决过拟合问题，通常有两种办法，第一是减少样本的特征维度；第二就是正则化（又称惩罚“penalty”）。正则化的一般形式是在整个平均损失函数后增加一个正则项（常见L2范数正则化，也有其他形式的正则化，它们的作用也不同。详见http://blog.csdn.net/zouxy09/article/details/24971995/）

　　λ=0代表不进行正则化；=1通常代表合适的惩罚；举个例子=100的时候，会因为过度惩罚而造成“欠拟合”问题

　　

归一化：主要看模型是否具有伸缩不变性。有些模型在各个维度进行不均匀伸缩后，最优解和原来不等价，例如SVM。

　　　　对于这样的模型，除非本来各维数据的分布范围就比较接近，否则必须进行标准化，以免模型参数被分布范围较大或较小的数据支配。

　　　　有些模型在各个维度进行不均匀伸缩后，最优解和原来等价，例如logistic regression（逻辑回归）。

　　　　对于这样的模型，是否标准化理论上不会改变最优解。但是，由于实际求解往往使用迭代算法，如果目标函数的形状太扁，迭代算法可能收敛得很慢甚至不收敛。所以对于具有伸缩不变性的模型，最好也进行数据标准化。

https://www.zhihu.com/question/20455227

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
正则化和归一化

正则化，归一化（标准化和正规化）：对数据进行预处理的两种方式，目的是让数据更便于计算和获得更加泛化的结果，但并不改变问题的本质。正则化：要求一个逻辑回归问题，假设一个函数，覆盖所有可能：y=wx，其中w为参数向量，x为已知样本的向量，用yi表示第i个样本的真实值，用f(xi)表示样本的预测值，从而确定损失函数L(yi,f(xi))=yi−sigmoid(xi)。该损失函数代表一种误差。对...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。