Machine Learning Foundation Lecture 04 Feasuibility of learning 学习笔记

最新推荐文章于 2024-01-19 16:18:47 发布

大肥猴

最新推荐文章于 2024-01-19 16:18:47 发布

阅读量1k

点赞数

分类专栏： Machine Learning 文章标签： machine learning

本文链接：https://blog.csdn.net/humozhi1/article/details/18938561

版权

Machine Learning 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

学习笔记4，机器学习的可行性

知识点1：有时候机器学习是做不到的。

为什么呢？请看如下的例子：图1的3张图片的y=-1，图2的3张图片y=+1，请问图3这张图片y=?

图1

图2

图3

如果是从对称性的角度来说图3中图片的y=+1，如果是从左上角是否是黑色块的角度来说图3中图片的y=-1。好像Learning是不可行的。

我们想要的事情是在资料以外的部分g能不能和f做的一样好，但是这个例子好像告诉我们”我们想要的事情是做不到的“，在机器学习中这类研究叫做No Free Lunch（天下没有白吃的午餐）。如果我们给机器资料，机器去学资料，到底资料以外发生什么事，通常我们是没有办法有任何的结论的（即g在我们所看过的资料以外对f好或者不好）。如果需要有结论，就要加上一些假设。

知识点2：Hoeffding不等式

从图4的例子中来理解什么是Hoeffding不等式。

图4

$\mu$ 代表瓶子中orange marble占整个瓶子的比例，未知，也不需要知道； $\nu$ 代表抽样的样本中orange marble占样本的比例，已知；

公式为，表示 $\mu$ 和 $\nu$ 之间的误差超过 $\epsilon$ 的概率是有上限的。我们可以说如果样本的数量N越大（则上限越小），那 $\mu$ = $\nu$ 大概差不多是正确的（probably approximately correct PAC），换句话说就是大概能够通过已知的 $\mu$ 来推理出未知的 $\nu$ 。

知识点3：Probability与Learning的关系

Bin	Learning
未知的orange marble的Probability，用 $\mu$ 来表示	fixed hypothesis h(x) =? target f(x)
marble $\in$ Bin	x $\in$ X
organe marble	h is wrong $\Leftrightarrow$ h(x) $\neq$ f(x) (有一个固定的h)
green marble	h is right $\Leftrightarrow$ h(x)= f(x) (有一个固定的h)
来自于Bin中抽取的Sample，Size用N来表示	Check h on D={( ${x}_{n}$ , $y_{n}$ )}

由此可以得到：如果我们的资料量足够的大（large N），并且 ${x}_{n}$ 是独立取样的，我们大概可以说：“从资料中得到的h( ${x}_{n}$ ) $\neq$ $y_{n}$ 的比例，大概可以推导出h(x) $\neq$ f(x)的比例。”

图5

$E_{out}$ （out of sample error）表示h和f在整个bin中是否一样，相当于 $\mu$ （未知）； $E_{in}$ （in sample error）表示在资料上h和y是否一样，相当于 $\nu$ （已知）；将 $E_{out}$ 和 $E_{in}$ 代入Hoeffding不等式，得到如下公式：