联合概率分布没法直接知道 ,没法求泛化误差,因此只能求泛化误差上界
泛化误差越小,泛化能力越好
1、数据量大,泛化误差上界趋于0
2、假设空间容量越大,模型越难学,泛化误差上界越大
泛化误差上界=经验风险+误差,N为样本容量,d为假设空间中函数的个数
经验风险是对损失函数求平均值
二、泛化误差上界推导
样本均值的期望等于总体的期望
下面为上面图片的证明
X为损失函数
泛化误差中的第一个不等式
泛化误差中的误差项
联合概率分布没法直接知道 ,没法求泛化误差,因此只能求泛化误差上界
泛化误差越小,泛化能力越好
1、数据量大,泛化误差上界趋于0
2、假设空间容量越大,模型越难学,泛化误差上界越大
泛化误差上界=经验风险+误差,N为样本容量,d为假设空间中函数的个数
经验风险是对损失函数求平均值
二、泛化误差上界推导
样本均值的期望等于总体的期望
下面为上面图片的证明
X为损失函数
泛化误差中的第一个不等式
泛化误差中的误差项