没有免费午餐定理

最新推荐文章于 2022-03-04 22:55:12 发布

郑师傅炒板栗

最新推荐文章于 2022-03-04 22:55:12 发布

阅读量2k

点赞数 1

文章标签：算法机器学习概率论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43306271/article/details/123010715

版权

人工智能专栏收录该内容

10 篇文章 2 订阅

订阅专栏

一、没有免费午餐定理

1. 概述

在机器学习算法的过程中存在问题：哪种机器学习算法更好？
由此提出没有免费午餐定理

No Free Lunch Theorem 是值：任何一个预测函数，如果在一些训练样本上表现好，那么必然在另一些训练样本上表现不好，如果不对训练样本在特征空间的先验分布有一定假设，那么表现好与表现不好的情况一样多。因此没有任何情况下都最好的机器学习算法。
先验概率与后验概率，博客参考

2. 例子1：

假设一台计算机上有两个存储单元，同时每个存储单元的位置要么属于第一类（以圆圈○表示），或者属于第二类（以X表示）；
这是一个两类的分类问题
假设我们知道一个存储单元的位置为圆圈；
我们要预测另一个存储单元的位置是圆圈（○）还是叉（×）；
这个预测有以下两种情况；
第一个存储单元为圆圈，第二个存储单元是圆圈和第一个存储单元为圆圈，第二个存储单元是叉；

在这里插入图片描述

如果我们不事先假设这两种情况的先验概率分布，那么一种合理的假设就是这两种情况的概率相同都是50%；
那么在这种情况下，我们预测不管第二个单元是○还是×对或错的概率都是一半；
同理多个单元；
无论计算机的存储单元有多少，无论我们知道多少个类别，对于剩下的格子类别不管做什么样的预测，结果不论对错的概率都是一半；
不管是什么样的算法，和我们随机的瞎猜都是没有区别的，那么问题出在哪里呢？
是因为假设各种情况的先验概率是一样的；（这样的假设是有问题的）

3. 例子2：

在这里插入图片描述

在设计机器学习算法的时候，有一个假设：
在特征空间上距离接近的样本，他们属于同一个类别的概率会更高。
在这种假设的情况下，前面所说的各种情况的先验概率就会不一致了，因此算法的预测才会有依据；
这个假设有道理吗？
道理是从以前的事实，经验，实践中来的；同时可以通过类比将“道理”推广到对未来的预测；
这样的预测很可能出错；

二、总结

没有免费午餐定理告诉我们：
	如果不对特征空间的先验分布有假设，则所有算法的表现都一样；

机器学习的本质：通过有限的已知数据，在复杂的高维特征空间中预测未知的样本的属性和类别；
再好的算法也存在犯错的风险；

郑师傅炒板栗

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
没有免费午餐定理

一、没有免费午餐定理1. 概述No Free Lunch Theorem 是值：任何一个预测函数，如果在一些训练样本上表现好，那么必然在另一些训练样本上表现不好，如果不对训练样本在特征空间的先验分布有一定假设，那么表现好与表现不好的情况一样多。因此没有任何情况下都最好的机器学习算法。2. 例子：...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。