李宏毅机器学习 Machine_Learning_2019_Task2

最新推荐文章于 2024-04-05 19:52:27 发布

风声想起

最新推荐文章于 2024-04-05 19:52:27 发布

阅读量210

点赞数

分类专栏：算法梳理

本文链接：https://blog.csdn.net/weixin_36466478/article/details/90450139

版权

13 篇文章 0 订阅

订阅专栏

概括：
算法的预测误差, 或者说泛化误差(generalization error)可以分解为三个部分: 偏差(bias), 方差(variance) 和噪声(noise). 在估计学习算法性能的过程中, 我们主要关注偏差与方差. 因为噪声属于不可约减的误差 (irreducible error).
偏差：
这里的偏指的是偏离 , 那么它偏离了什么到导致了误差? 潜意识上, 当谈到这个词时, 我们可能会认为它是偏离了某个潜在的 “标准”, 而这里这个 “标准” 也就是真实情况 (ground truth). 在分类任务中, 这个 “标准” 就是真实标签 (label).
$$
方差：
方差描述的是预测结果的稳定性，即数据集的变化对于预测结果的影响，同样也度量了数据集变化对于模型学习性能的变化，方差越小，说明我们的模型对于数据集的变化越不敏感，也就是对于新数据集的学习越稳定.

在这里插入图片描述
泛化误差：
以回归任务为例, 学习算法的平方预测误差期望为:

方差：
在一个训练集 D上模型 f对测试样本 x的预测输出为 f(x;D), 那么学习算法 f对测试样本 x 的期望预测为:

上面的期望预测也就是针对不同数据集 D, f 对 x 的预测值取其期望.

使用样本数相同的不同训练集产生的方差为:
在这里插入图片描述
噪声:
噪声为真实标记与数据集中的实际标记间的偏差:

偏差：
期望预测与真实标记的误差称为偏差(bias), 为了方便起见, 我们直接取偏差的平方:

在这里插入图片描述
对算法的期望泛化误差进行分解:

在这里插入图片描述

…未完待续

关注