P7机器学习笔记--李宏毅（如何让选到坏的训练集的概率降低）

最新推荐文章于 2023-06-02 20:44:52 发布

温涛

最新推荐文章于 2023-06-02 20:44:52 发布

阅读量153

点赞数 1

分类专栏：关系抽取Casrel

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013373155/article/details/127203648

版权

关系抽取Casrel 专栏收录该内容

1 篇文章 2 订阅

订阅专栏

目录

一、一些概念定义

二、例子讲解

当我们把N调大时

当我们把|H|调小时

一、一些概念定义

如果分辨宝可梦和数码宝贝？

通过观察我们发现数码宝贝的绘画风格更复杂:

所以我们设计了一个函数:

其中|H|为所有候选的functions

定义一个损失函数：

其中D为被给的资料，y^就是对应正确的值

我们的理想状态是我们知道所有的宝可梦和数码宝贝，并且获得了一个让loss最小的h all让我们更好的分辨宝可梦和数码宝贝。但是现实是我们只有训练集也就是一小部分。我们从训练集得到的h数据希望在所有数据上表现得很好。让现实和理想更接近

二、例子讲解

同样都是选了200个资料，当他们在训练资料上表现最好的时候不一定在所有资料上表现最好

我们想要的是什么？我们想要的是现实和理想更接近那么就要满足以下公式

满足上面的公式，我们肯定必须要好的train资料，所以我们要计算获得坏的Dtrain资料的概率：

其中坏掉的几率公式为：

其中大N为训练资料中样本的数目

我们想要让这个概率变小，就要让N变大|H|变小

当我们把N调大时

选到坏的训练资料概率明显下降，但是说我们做实际任务时，训练资料不是我们可控的。平时我们可以通过这个式子算出我们希望的N是多大

当我们把|H|调小时

当我们把|H|调小是，确实能缩小现实与理想的差距，但是|H|太小时！你可能会理想崩塌，就是你找出来理想的值有可能就不是最理想的了

我们陷入了两难，怎样让熊和鱼掌兼得呢？下一章再说

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
P7机器学习笔记--李宏毅（如何让选到坏的训练集的概率降低）

P7机器学习笔记--李宏毅（如何让选到坏的训练集的概率降低）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。