台湾大学林轩田《机器学习基石》学习笔记第4讲——Feasibility of Learning

最新推荐文章于 2021-07-13 21:17:38 发布

1021stones

最新推荐文章于 2021-07-13 21:17:38 发布

阅读量465

点赞数

分类专栏：林轩田机器学习笔记文章标签： Machine Learning 机器学习基石林轩田学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Stoneeeee/article/details/82454362

版权

本文深入探讨机器学习的可行性，通过No Free Lunch定理揭示学习的挑战，并借助PAC（Probably Approximately Correct）理论，阐述当样本数量足够大时，如何确保模型在未知数据上的预测性能。霍夫丁不等式在其中起到关键作用，保证了在有限假设集合下，机器学习是可行的。

摘要由CSDN通过智能技术生成

上节课，我们主要介绍了机器学习可以根据元素的不同情况分为不同的类型。其中，监督式学习、非监督式学习、半监督式学习和增强学习。本节课，我们将介绍机器学习的可行性，讨论问题是否可以使用机器学习来解决。

一、Learning is Impossible？
机器学习一定是可行的吗？
这里写图片描述

第一个例子，我们可以找到不同的g(x)，它同时满足所有训练样本D；
但当有一个新的x输入时，应用不同的g(x)，会得到完全相反的y；
那么我们认为这个机器学习并没有学习到!？

这里写图片描述

第二个例子，我们找到这样一个g≈f，可以满足所有的训练样本D
但是在D以外的未知数据上，g≈f不一定成立。
而机器学习目的，恰恰是希望我们选择的模型能在未知数据上的预测与真实结果是一致的，而不是在已知的数据集D上寻求最佳效果。

所以我們想要的是资料以外的部分。但是这两个例子好像告我们想要的事情是做不到的。我们把这一系列的研究叫做No Free Lunch（没有免费的午餐）。NFL理论告诉我们：

不存在一个与具体应用无关的，普遍适用的“最优分类器”
学习算法必须要作出一个与问题领域有关的“假设”，分类器必须与问题域相适应。

In the field of optimization, the NFL means that without a prior assumption about the specific problem, no strategy can be expected to perform better than any other.
So, make no efforts on distinguishing better strategies when you know nothing about the dataset. There is no universal optimal strategy.【

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。