损失函数、正则化、交叉验证

最新推荐文章于 2024-01-25 23:48:23 发布

changtingwai58

最新推荐文章于 2024-01-25 23:48:23 发布

阅读量1.9k

点赞数 1

分类专栏： ML 文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_27612639/article/details/51898685

版权

ML 专栏收录该内容

31 篇文章 0 订阅

订阅专栏

期望风险或期望损失：是真实的，需要x,y的联合概率分布相乘
经验风险或经验损失：机器学习问题不可能已知x,y的联合概率分布，如果已知的话，那么x得出y就很容易了。那么根据大数定理可以使用1/n*损失函数来代替期望风险，得出经验风险。

结构风险最小化：是带正则项的经验风险最小化。
经验风险最小化容易带来模型复杂度过高，过拟合问题

正则化：
是结构风险最小化策略的实现。正则化项一般是模型复杂度的单调递增函数，模型越复杂，正则化值就越大

范数：
0范数表示的是向量中非0元素的个数
1范数表示的是向量中元素的绝对值的和
2范数表示的是向量中元素的模的和

模型的稀疏化得优点：是可以实现自动特征选择和优秀的特征可解释性。

想要模型稀疏，最好的方法是使用正则化0范数。但是0范数是不好求w的最优化解得。并且l1是l0的最优凸近似。如果w在0点处不可微（l1就不可微)，且可以分解为一个求和的形式，那么这个规则化算子就可以实现稀疏.
l2范数会使模型的参数很小，但是不能为0。l2相比L1具有更平滑的特性。当遇到两个对预测有帮助的特征时，L1倾向于选择一个更大的特征。而L2更倾向把两者结合起来。

交叉验证：
1、简单验证，70%训练集，30%测试集。使用此方法不断的选择模型和参数，比较测试集的准确率。
2、kfold，将数据集切分成k份，随机选择k-1做训练集，1做测试集。最后选出S次评测中平均测试误差最小的模型。

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。