机器学习基础(林軒田)笔记之六

最新推荐文章于 2020-05-08 11:16:40 发布

独孤九戒

最新推荐文章于 2020-05-08 11:16:40 发布

阅读量2.2k

点赞数 1

分类专栏：机器学习文章标签：机器学习林軒田

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiong452980729/article/details/52122081

版权

机器学习专栏收录该内容

19 篇文章 1 订阅

订阅专栏

机器学习基础(林軒田)笔记之六

Theory of Generalization(机器学习的一般化)

一.Restriction of Break Point(断点的限制)

首先，回顾上一节课中所讲述的成长函数和断点机制。
成长函数：假设空间在N个样本点上能够产生的最大二分类的数量；

断点机制：不能满足完全分类的样本点个数，完全二分类可以有种情形。

下面假设分类的最小断点数举例说明：

下图中为N=1,2的时的情况；

下面几个图为N=3时的情况；

由上面三图可知当为不重复的三种二分类情况时，符合题设的不存在两个点完全二分的情况，下图为第四种不重复的二分类情况，此时x2和x3出现完全二分情况；

变换二分类的方式得到第四种不存在任意两个点完全二分的情况；

第五种二分方式会造成两个点完全二分，不符而要求；

结论，最多存在四中划分方式满足任意两个点不存在完全二分类的情况。

得出猜想：

二.Bounding Function: Basic Cases(上限函数的基本情况)

下面我们将上面的猜想定义为一个上限函数：，表示在断点为k时成长函数的最大值。

通俗的讲，就是对维度为N的向量进行二分类，在保证其中任意k个特征不能完全二分的分类种类的最大值。

例如：

结果：

三.Bounding Function: Inductive Cases(边界函数的归纳情况)

本节课我们完成上节课中表格的剩余部分。

猜想B(4,3)是否与B(3,?)有关：

写一个计算机程序求B(4,3)，得：

整理得到：

进一步：

进一步，忽略x4，只看橘色的部分：

推论：

由此，我们可以证明上限函数的上限：

证明如下：

已知，

当k=1时上式显然成立；

当时，假设，成立，则：

得证。

综上我们可以得出，成长函数会被上限函数bound，上限函数会被上限函数边界bound，上限的上限会被某个多项式bound。

例：

四.A Pictorial Proof(形象化的证明)

基于第三节，我们得到成长函数的上界，那么我们将成长函数直接代入霍夫丁不等式中就能证明机器学习是可行的，但是实际的结果与其稍微有些差别，见下图(证明难度较大，不予以证明)：

下面介绍这些微妙的差别是如何发生的：

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
机器学习基础(林軒田)笔记之六

本文为台湾大学林軒田老师的机器学习基础网络课程第六节课的课程笔记。
复制链接

扫一扫

专栏目录

独孤九戒 CSDN认证博客专家 CSDN认证企业博客

码龄12年

92: 原创

18万+: 周排名

129万+: 总排名

50万+: 访问

: 等级

3600: 积分

118: 粉丝

213: 获赞

22: 评论

738: 收藏

私信

关注

热门文章

分类专栏

最新评论

C++中string转int
m0_74866479: 你好，请问stringstream，如果我想要转化的数字的位数，溢出了怎么处理
静态成员函数与非静态成员函数的区别
不要加班: 复试有得说了
静态成员函数与非静态成员函数的区别
刘敬_: 思路清晰，言简意赅，感谢总结
C++中string转int
ProfSnail: 兄弟，这句话写错了。c_str()转换到第一个非数字字符为止。应该是atoi转换到第一个非数字字符为止，c_str()会原样照搬string中内容的。
相机标定（二）之相机畸变模型
hugice 回复 qq_42831775: 用MATLAB标定可以直接得到结果

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。