机器学习基石-Three Learning Principles

最新推荐文章于 2020-07-31 18:30:41 发布

遇见更好的自己

最新推荐文章于 2020-07-31 18:30:41 发布

阅读量236

点赞数

分类专栏：机器学习台大林轩田机器学习课程笔记文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yc1203968305/article/details/78647018

版权

机器学习同时被 2 个专栏收录

42 篇文章 2 订阅

订阅专栏

台大林轩田机器学习课程笔记

27 篇文章 5 订阅

订阅专栏

大纲

这里写图片描述

Occam’s Razor

Simple Model

这里写图片描述

简单的假设是指包含更少的参数
简单的模型是指包含更少的假设
简单的模型通常意味着简单的假设

Simple is Better

那为什么简单的模型更好呢？下面从哲学的角度简单解释一下。机器学习的目的是“找规律”，即分析数据的特征，总结出规律性的东西出来。假设现在有一堆没有规律的杂乱的数据需要分类，要找到一个模型，让它的 $E_{in}$ =0，是很难的，大部分时候都无法正确分类，但是如果是很复杂的模型，也有可能将其分开。反过来说，如果有另一组数据，如果可以比较容易找到一个模型能完美地把数据分开，那表明数据本身应该是有某种规律性。也就是说杂乱的数据应该不可以分开，能够分开的数据应该不是杂乱的。如果使用某种简单的模型就可以将数据分开，那表明数据本身应该符合某种规律性。相反地，如果用很复杂的模型将数据分开，并不能保证数据本身有规律性存在，也有可能是杂乱的数据，因为无论是有规律数据还是杂乱数据，复杂模型都能分开。这就不是机器学习模型解决的内容了。

Sampling Bias

Sampling Bias

技术上的解释：训练数据来自分布 $P_{1}$ ,而测试数据来自分布 $P_{2}$ , $P_{1} \neq P_{2}$
物理上的解释：努力学习数学，结果是英语考试。
如果训练数据和测试数据不来自同一个分布，那么VC Bounds就会失效

Dealing With Bias

尽量让测试数据和训练数据服从独立同分布

Data Snooping

Power of Three

Three Theoretical Bounds

这里写图片描述

Hoeffding 理论是针对单个假设，所以他对于测试理论有帮助
Muti-Bin Hoeffding理论是针对M个假设，所以对于验证理论有帮助
VC理论是针对无限的假设，所以他对于训练理论很有帮助

遇见更好的自己

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。