【自学笔记】过拟合与正则化

zyq~

于 2024-08-09 00:04:07 发布

阅读量811

点赞数 27

分类专栏：机器学习文章标签：笔记 python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40432278/article/details/141038157

版权

过拟合

分类任务的本质其实是找到边界，将不同类型的数据区分开，之前我们做的是尽量让这个边界更贴近每一个数据点，达到拟合的作用。
然而，极端数据的存在或要求模型的特征数过多，会导致过拟合现象的出现。它会导致模型在训练集表现优异，但是在测试集准确率不高，这显然不是我们想要的。

在这里插入图片描述

术语“偏置（Bias）”和“方差（Variance）”

偏置描述了学习算法的期望预测与真实结果之间的偏差。高偏置与欠拟合成正比。
方差表示模型预测结果的波动程度，即模型在不同训练集上的预测值的变化程度。高方差与过拟合成正比。

偏置-方差权衡（Bias-Variance Tradeoff）

要控制模型的偏置和方差，避免欠拟合和过拟合的出现。

正则化

正则化的本质是引入额外信息（偏置）来惩罚极端的参数值。
常见的L1，L2正则化就是在代价函数末尾加上关于w的式子，使w过大时代价函数也会过大。

L1正则化

$J(\vec{w}) = J_{0}(\vec{w}) + \lambda\sum_{j=1}^{m}|w_{j}|$
其中 $J_{0}$ 是原代价函数， $\lambda$ 为

最低0.47元/天解锁文章

博客等级

码龄8年

45
原创

975
点赞

870
收藏

675
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

【论文阅读笔记】模型的相似性
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【自学笔记】推荐系统
zyq~: 这里只是推荐系统的大致框架思路，细化的话两种模型结构可以更针对性地设计，来适应不同类型的特征。查了一下，可以试试引入注意力机制，还可以做特征工程，进行特征组合，来找到最能代表用户和内容的特征，减少噪声
【自学笔记】推荐系统
征途黯然.: 如何优化TensorFlow中基于内容的推荐系统，实现更精准的样本特征向量匹配与检索排名算法？
【论文阅读笔记】BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Langu
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读笔记】BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding...
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。