泛化能力/生成模型和判别模型-2022年1月24日

最新推荐文章于 2023-07-06 17:26:39 发布

逻辑本人

最新推荐文章于 2023-07-06 17:26:39 发布

阅读量1.1k

点赞数

分类专栏：每日精进-随记文章标签：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51879748/article/details/122664947

版权

每日精进-随记专栏收录该内容

26 篇文章 0 订阅

订阅专栏

泛化能力

指的是学习方法的泛化能力，而不是学习到的模型的泛化能力。
是学习所得到模型对于新数据的预测能力，是学习方法本质上重要的性质
我们一般会采用测试数据集评价学习方法的泛化能力，但是这种评价只依赖于测试数据集，所以得出的评价结果可能是不可靠的。
故统计学习方法试图从理论上对学习方法的泛化能力进行分析。

泛化误差

反应了学习方法的泛化能力，是学习所得到的模型对于新数据预测的误差，其实就是所学习到的模型的期望风险。
在这里插入图片描述
泛化误差越小的模型越有效。
二维随机变量的数学期望？

泛化误差上界

学习方法的泛化能力的研究通常是通过研究泛化误差的概率上界进行的。通过比较两种学习方法的泛化误差上界来比较他们的优劣。
在这里插入图片描述
不等式左边是泛化误差；右边是泛化误差上界，第一项是训练误差，d是假设空间中函数个数，N是样本容量
为什么不用泛化误差？因为泛化误差上界具有优良性质。
假设空间容量就是可能取得模型个数

生成模型和判别模型

generative model：由数据先学习联合分布概率，进而根据条件概率公式得到条件概率分布
典型的生成模型有：朴素贝叶斯法、隐马尔可夫模型
discriminative model：由数据直接学习决策函数或者条件概率分布
典型的判别模型有：k近邻法、感知机、决策树等
在这里插入图片描述

监督学习的应用

分类问题
标注问题
回归问题
F1score是精确率和召回率的调和均值
在这里插入图片描述
输出变量是有限个取值的时候是分类问题
输入和输出变量是变量序列的时候是标注问题
输入和输出变量是连续变量的时候是回归问题

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
泛化能力/生成模型和判别模型-2022年1月24日

泛化能力指的是学习方法的泛化能力，而不是学习到的模型的泛化能力。是学习所得到模型对于新数据的预测能力，是学习方法本质上重要的性质我们一般会采用测试数据集评价学习方法的泛化能力，但是这种评价只依赖于测试数据集，所以得出的评价结果可能是不可靠的。故统计学习方法试图从理论上对学习方法的泛化能力进行分析。泛化误差反应了学习方法的泛化能力，是学习所得到的模型对于新数据预测的误差，其实就是所学习到的模型的期望风险。泛化误差越小的模型越有效。二维随机变量的数学期望？泛化误差上界学习方法的泛化能力的研
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。