特征缩放、交叉验证、拟合、正则化概念

最新推荐文章于 2023-03-23 15:10:40 发布

xiaoming1999

最新推荐文章于 2023-03-23 15:10:40 发布

阅读量246

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaoming1999/article/details/120989720

版权

机器学习专栏收录该内容

18 篇文章 3 订阅

订阅专栏

目录

如何防止过拟合

特征缩放

数据归一化：把数据的取值范围处理为0-1或者-1 - 1之间。任意一组数据转化为0-1之间：任意一组数据转化为-1 - 1之间：
均值标准化： x为特征数据，u为数据的平均值，s为数据的方差

交叉验证

将数据分成k份，然后取其中一份作为测试集，其余k-1份为训练集，然后求得误差的平均值作为最终评价。

拟合

欠拟合：在训练集和测试集上的性能都较差

拟合：在训练集和测试集上的性能都比较好

过拟合：能较好地学习训练集数据的性质，而在测试集上的性能较差

如下图所示，可以直观的展现出欠拟合，拟合，过拟合的性质：

如何防止过拟合

减少特征
增加数据量
正则化

正则化

正则化是机器学习中对原始损失函数引入额外信息，以便防止过拟合和提高模型泛化性能的一类方法的统称。也就是目标函数变成了原始损失函数+额外项

正则化代价函数：

L1正则化：
L2正则化：

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
特征缩放、交叉验证、拟合、正则化概念

特征缩放
复制链接

扫一扫

专栏目录

xiaoming1999 CSDN认证博客专家 CSDN认证企业博客

码龄7年

114: 原创

2万+: 周排名

182万+: 总排名

7万+: 访问

: 等级

1281: 积分

2495: 粉丝

56: 获赞

12: 评论

187: 收藏

私信

关注

热门文章

分类专栏

最新评论

决策树---ID3算法、C4.5算法、CART算法
黎曼最初的梦想: 博主你好，请问一下，如果我要使用C4.5算法的话，criterion的参数应该设为什么呢？
集装箱装载问题
An_Sleeper: 好的谢谢
集装箱装载问题
xiaoming1999: 103行代码是C++范围for的使用你可以搜搜看
集装箱装载问题
xiaoming1999: 刚看代码是的是一个船的问题了思路不影响刚把问题描述修改了哈哈
集装箱装载问题
An_Sleeper: 大佬不知道是不是我没看懂，你的代码到最后是不是成单船装货问题了？输出里面只有第一个船的结果？容量也只设置了一个船的容量。对了还有个问题，103行的 “int v : bestx”是什么意思啊？百度也没查到这种：的用法，而且可能是因为这一行，codeblocks运行这段代码会出bug，但用visual studio就可以正常运行。是C++新出的用法吗？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。