【AI知识点】泛化（Generalization）与过拟合（Overfitting）

AI完全体

已于 2024-10-15 09:47:13 修改

阅读量4.2k

点赞数 20

分类专栏： AI知识点文章标签：人工智能深度学习机器学习大模型训练自然语言处理计算机视觉神经网络

于 2024-10-03 14:05:11 首次发布

本文链接：https://blog.csdn.net/weixin_43221845/article/details/142691525

版权

【AI论文解读】【AI知识点】【AI小项目】【AI战略思考】

泛化（generalization） 是机器学习中的一个核心概念，指的是模型在训练数据之外的新数据上表现得如何。换句话说，泛化能力衡量的是模型能否在未见过的样本上做出正确的预测或推断。

1. 泛化的背景

当我们训练机器学习模型时，模型会基于训练数据中的模式进行学习。然而，训练数据只是现实世界的一个有限子集。为了让模型在真实场景中表现良好，它需要具备从有限的训练数据中学到的知识有效地应用到新的、未见过的数据上的能力，这就是泛化。

2. 过拟合与欠拟合

在理解泛化时，两个常见的概念是过拟合和欠拟合，它们都与模型的泛化能力紧密相关。

a. 过拟合（Overfitting）：

当模型在训练数据上表现得非常好，甚至可以完全记

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

AI完全体

关注关注

20
点赞
踩
19

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

ML基础教程：泛化与过拟合、正规化最小二乘法

松子茶的专栏

07-27

2566

Load the Olympic data and extract the training and validation data.An example of regularised least squares Data is generated from a linear model.

机器学习、AI领域研究知识点

AI天才研究院

08-07

813

本文由我个人创作，旨在分享我对机器学习、AI领域研究的见解和经验，力求用最生动、通俗易懂的方式阐述这些知识点。同时，我希望通过这个平台能够为广大的AI爱好者提供一个交流、学习、探讨的平台，共同进步。文章主要面向所有AI相关从业人员，如机器学习工程师、数据科学家、产品经理、算法工程师等。让我们一起踏上机器学习不断前行的道路！本站涉及到的主题包括但不限于机器学习、深度学习、NLP、CV、推荐系统、强化学习、广告算法、图像处理、语音识别等多个方向。希望大家能持续关注并提供宝贵意见。

1 条评论您还未登录，请先登录后发表或查看评论

泛化和过拟合

weixin_41609899的博客

01-16

3349

泛化能力泛化能力用来表征学习模型对于未知数据的预测能力。很显然，我们没有办法对所有的数据进行预测然后判断来计算一个模型的模型的泛华能力，所以在实际应用当中，我们一般还是用的测试集中的数据来近似泛化能力。 过拟合 当某个模型过度的学习训练数据中的细节和噪音，以至于模型在新的数据上表现很差，我们称过拟合发生了。这意味着训练数据中的噪音或者随机波动也被当做概念被模型学习了。而问题就在于这些概

王立威谈AI理论发展：泛化理论能否加速“牛顿时代”到来

网易智能

07-29

406

关注网易智能，聚焦AI大事件，读懂下一个大时代！7月28日，在深圳举办的2018中国人工智能大会上，北京大学教授王立威发表了题为《机器学习简介—方法、应用与展望》的演讲，...

超越实验室：打造真正在现实世界中奏效的 AI (泛化性与鲁棒性)

最新发布

海棠AI实验室

02-17

901

泛化性和鲁棒性是确保 AI 能在复杂、动态的现实世界中有效运行的关键。尽管当前的 AI 模型在许多任务中已经取得了显著成就，但要让 AI 在更广泛的应用场景中真正发挥作用，我们仍需不断改进和优化这些模型，克服泛化性与鲁棒性带来的挑战。通过迁移学习、数据增强、对抗训练等技术手段，我们有望让 AI 系统在更加复杂和不可预测的环境中展现出更强的适应能力和稳定性。随着技术的发展，未来的 AI 将不再仅仅在实验室中表现出色，它们将能够在真实世界中持续可靠地运行，真正释放出其变革性的潜力。

机器学习笔记(四) 机器学习（泛化,过拟合, 数据集，验证集，测试集）

sazass的博客

02-13

3462

泛化 (Generalization) 泛化是指模型很好地拟合以前未见过的新数据（从用于创建该模型的同一分布中抽取）的能力。 过拟合： 过拟合模型在训练过程中产生的损失很低，但在预测新数据方面的表现却非常糟糕，即泛化能力差；产生原因：过拟合是由于模型的复杂程度超出所需程度而造成的。机器学习的基本冲突是适当拟合我们的数据，但也要尽可能简单地拟合数据。奥卡姆的威廉是 14 世纪一位崇尚简单的修士...

AI 训练中不收敛、欠拟合、过拟合、泛化能力是什么意思？

本博客，博文仅代表个人操作经验，不能完全解决你的问题，仅供参考，佛系回复。

03-07

1502

AI 训练中不收敛、欠拟合、过拟合、泛化能力是什么意思？

机器学习算法中的过拟合与欠拟合

skysys的研究小屋

01-13

840

在机器学习表现不佳的原因要么是过度拟合或欠拟合数据。机器学习中的逼近目标函数过程监督式机器学习通常理解为逼近一个目标函数(f)(f)，此函数映射输入变量(X)到输出变量(Y).Y=f(X)Y=f(X)这种特性描述可以用于定义分类和预测问题和机器学习算法的领域。从训练数据中学习目标函数的过程中，我们必须考虑的问题是模型在预测新数据时的泛化性能。泛化好坏是很重要的，因为我们收集到的数据只是样本，其带

分类算法的过拟合与泛化能力

AI天才研究院

12-27

874

1.背景介绍分类算法是机器学习中最基本的算法之一，它主要用于将输入数据划分为不同的类别。然而，随着数据的增加和复杂性的提高，分类算法可能会面临过拟合和泛化能力不足的问题。在本文中，我们将讨论分类算法的过拟合与泛化能力，以及如何解决这些问题。 1.1 分类算法的基本概念分类算法是一种用于将输入数据分为不同类别的算法。它通常用于解决二分类问题，即将输入数据分为两个类别。例如，在垃圾邮件过滤问...

【机器学习基础】泛化能力、过拟合、欠拟合、不收敛、奥卡姆剃刀原则

wzk4869的博客

08-25

2723

【机器学习基础】泛化能力、过拟合、欠拟合、不收敛、奥卡姆剃刀原则

机器学习之泛化与过拟合的概念

牛牛博士博客

09-24

1264

机器学习之泛化与过拟合的概念

泛化、欠拟合、过拟合以及如何預防

weixin_45113398的博客

11-18

1685

深度学习几个概念

大数据与人工智能方向基础 ---- 模型的选择与性能评价

m0_62076854的博客

12-28

1225

学习能力，泛化能力，过拟合，欠拟合，划分数据集D的典型实现方式（留一法，交叉验证法，自助法），错误率与精度，查准率与查全率，F1，ROC与AUC，代价敏感错误率与代价曲线，均方误差，均方根误差，平均绝对误差，中值绝对误差

机器学习·西瓜书|知识点梳理-第二章

BlueEstrella的博客

11-13

1084

若令训练集S包含绝大多数样本，则训练出的模型可能更接近于用D训练出的模型，但由于T比较小，评估结果可能不够稳定准确若令测试集T多包含一些样本，则训练集S与D差别更大了，被评估的模型与用D训练出的模型相比可能有较大差别，从而降低了评估结果的保真性(fidelity)．。例如通过对D进行分层采样而获得含70％样本的训练集S和含30％样本的测试集T,若D包含500个正例、 500个反例，则分层采样得到的S应包含350个正例、350个反例，而T则包含150个正例和 150个反例；而查全率高时，查准率往往偏低。

周志华《机器学习》自学知识点笔记（第一、二章）

m0_74756644的博客

10-23

589

非形式化定义：将人的“经验”作为计算机的“数据”，让计算机来学习这些经验数据，从而得到一个算法模型，同时在面对新的情况时，计算机能够做出准确有效的判断。形式化定义：假设T为计算机程序希望实现的任务类，P为计算机程序在某任务类T上的性能，E为经验，即历史的数据集。若该计算机程序通过利用经验E在任务T上获得了性能P的改善，则称该程序对E进行了学习。

什么是模型的泛化能力与过拟合

qq_45207431的博客

07-14

5336

泛化能力：模型或者分类器对未知新样本分类能力。简单理解就是模型训练之后，对没有进行训练的数据集分类能力。 过拟合：过分追求模型对样本集分类的正确性，导致泛化能力下降。简单理解就是在对样本集进行分类的时候，在边界区域难免还有分类错误的情况，是正常的，如果要求模型对样本集几乎接近100%的正确率，反而会造成模型本身对未知样本的分类能力急剧下降，所以模型最好在正确率和泛化能力做好平衡调节，才能优化模型。 ...

基于知识图谱的知识泛化让AI学会“举一反三”

Giantan的博客

12-08

1166

比尔·盖茨曾说“自然语言处理是人工智能皇冠上的明珠”。在上周刚结束的“2019CCF-GAIR全球人工智能与机器人峰会”上，微软亚洲研究院副院长周明博士指出“人在理解的时候有常识、有背景，所以能够理解；可电脑没有常识、没有背景，只是根据字面来处理，因此它理解的都是一样的。这就是自然语言处理的难处。”确实，人类的“智能”是在适应和理解复杂多变的物理和社会环境的过程中进化而来, 并非只适用于解决具有明确规则的任务或游戏。而当前，如何让机器能够像人一样思考，能够理解、解释并进行推理决策，即获得人类所独有的认知能力

泛化能力和拟合能力的区别，偏差与方差的区别

此生不换的博客

06-21

8431

在机器学习领域，最怕出现的就是过拟合，也就是训练出来的模型在训练集上进行测试，效果很好（一般来讲，在神经网络训练中，随着迭代次数的增加，模型的拟合能力会变得越来越好，如下图中的红线部分），但是在测试集上效果很差（也就是泛华能力变得很差，举个栗子，对于加法准则来讲，1+1=2，随着迭代次数来讲，每一次1+1都能算出等于2，但是突然测试集来了一个100+100，模型只能够计算1+1的，不能计算100+...

机器学习1：泛化（过拟合、欠拟合）

qq_51715775的博客

05-14

5205

机器学习1：泛化（过拟合、欠拟合）泛化理解判断过拟合欠拟合机器学习中的逼近目标函数过程统计拟合机器学习中的过拟合机器学习中的欠拟合机器学习中好的拟合个人理解泛化就是让机器具有举一反三的能力 机器学习（深度学习）的根本问题是优化和泛化之间的对立。泛化优化（optimization）是指调节模型以在训练数据上得到最佳性能（即机器学习中的学习），而泛化（generalization）是指训练好的模型在从未见过的数据上的性能好坏。 机器学习的目的当然是得到良好的泛化，但是无法控制泛化，只能基于训练数据调节模型

深入解析深度学习技术与应用英文版

### 深度学习方法及应用知识点概述 #### 标题解析标题“深度学习方法及应用英文版 Deep Learning Methods and ...深度学习作为AI领域的前沿技术，不断推动着人工智能的进步，并在工业界和学术界产生了广泛的影响。