加州理工学院公开课：机器学习与数据挖掘_Radial Basis Function（第十六课）

最新推荐文章于 2017-12-20 20:49:43 发布

置顶飞天狐213

最新推荐文章于 2017-12-20 20:49:43 发布

阅读量1.4k

点赞数

分类专栏：机器学习文章标签： RBF 数据挖掘机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/feitianhu213/article/details/42967667

版权

机器学习专栏收录该内容

20 篇文章 1 订阅

订阅专栏

课程简介 :

主要介绍了 RBF 模型及其与最近邻算法、神经网络、Kernel Method 的比较。最后介绍了 RBF 模型的 regularization 问题。

课程提纲 :

1、what is RBF

2、RBF and nearest neighbors

3、RBF and neural networks

4、RBF and kernel methods

5、RBF and regularization

1、what is RBF

RBF 是基于半径的一个模型。因为训练集中的每一个点都会对训练集（h(x)）造成影响，但是影响的方式会因问题而异。这一节课主要讨论的是训练集中的点对模型的影响是基于：||X-Xn|| 的形式的。也就是说是基于半径的（based on radial ）。

标准形式：（下面的模型是高斯分布模型，当然也可以用其它的模型，但是既然是radial based，那么就必须得存在||x-xn||项）

有了模型，我们还需要学习它的参数，上述公式中的参数主要有两个：wn 和 γ。γ 会影响高斯分布曲线的形状（肥瘦）。现在暂时放下 γ 参数，先来看看如何学习 wn。

学习的前提是要有一个指导方针。这里的指导方针就是h(xm) == ym。其中 ym 是数据的真实值（对于分类问题就是标签）。

所以我们的问题就是解下面的方程：（为了一致性，下述公式中的xm对应上述公式的 xn，下述公式中的 xn 对应上述公式中的 x）

用矩阵表示如下：

如果矩阵可逆，则有：（听说可以利用插入法求解）

到目前为止，我们可以成功的利用训练数据求得参数 W ，一切都很顺利，那么是不是说明只要我们再把 γ 求出来就可以了呢？

答案是否定的，因为这里存在一个过拟化的问题。显然上述的方法得到的解，对于样本内数据来说，误差为 0，之前说过，这并不是一件好事，因为这样会导致泛化能力减弱。这里利用到的解决方法是：聚类。

2、RBF and nearest neighbors

对于第一点中提到的过拟化问题，可以利用聚类方法进行解决。

基本思路：利用某种方法（比如：k-means）把训练数据聚成 k 个类。每个聚类中心代表该类进行训练。

因此模型变为：

针对上述模型，存在两个问题:

1、如何选择 k 个中心点。

2、如何学习 wk。

第一点可以利用 k-means 方法解决。现在主要看看第二点：

由于现在参数 wk 变为k个，因此该模型会存在误差，有：

通过解上述方程，我们可以求出 W（具体怎么解？还得恶补线性代数。。。）

现在剩下的问题就是如何求解 γ 了。下面用到的方法叫做：混合高斯模型的期望最大化（EM algorithm in mixture of Gaussians）

第一步：固定 γ，求解 W

第二步：固定W，求出使模型误差最小时对应的 γ。

第三步：跳回第一步，直到满足终止条件。（迭代m次等。）

3、RBF and neural networks

通过上面步骤，已经可以求解出 RBF 模型了。现在看看其与神经网络的比较：

通过上图我们可以知道：

1、RBF network 和 neural network 在形式上是一致的。

2、对于 RBF network 第一级输入参数是固定的：||x-μi||，但是对于 neural network，对应的参数需要通过反向传播进行学习。

3、对于 RBF network 当第一级输入值很大的时候，对应节点的输出会变得很小（高斯模型），而对于 neural network 则不存在这一特点，根具体节点使用的函数有关。

4、RBF and kernel methods

再来看看 RBF 与 SVM kernel 的对比。

首先在形式上：

SVM kernel： RBF：

对于 RBF ，增加额外的参数b，并且转变为而分类问题。这样是为了更方便地与 SVM kernel 比较。

我们关心的第一个问题是：它们的表现如何？下面的图显示了这两个模型的表现（绿色线表示目标函数）：

可以看到，虽然是来自两个不同世界的模型，但是他们的表现却很接近（SVM 更好一点），不过在具体的问题中，很难说清楚谁的效果更好。

注意，上图中RBF 用到的聚类数量 k == svm 中的支持向量数。

5、RBF and regularization

注意：关于聚类中的 k 如何选择？我开始认为是否可以计算出 VC 维作为参考？在课堂最后的时候学生也问到这个问题，不过教授说不能这样做。是 k -> VC 而不是 VC->k.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
加州理工学院公开课：机器学习与数据挖掘_Radial Basis Function（第十六课）

课程简介 :主要介绍了 RBF 模型及其与最近邻算法、神经网络、Kernel Method 的比较。最后介绍了 RBF 模型的 regularization 问题。
复制链接

扫一扫

专栏目录

飞天狐213 CSDN认证博客专家 CSDN认证企业博客

码龄12年

37: 原创

24万+: 周排名

187万+: 总排名

12万+: 访问

: 等级

1578: 积分

60: 粉丝

31: 获赞

12: 评论

72: 收藏

私信

关注

热门文章

分类专栏

机器学习 20篇
图像处理 2篇
数据结构 3篇
C/C++ 11篇
随感小记 2篇
OpenCv 2篇
问题小结 2篇
计算机网络 1篇
Kinect 5篇
字符编码 3篇
git 2篇
Unix/Linux 1篇
MATLAB 1篇
mex
CRF 1篇
公开课 1篇

最新评论

Kinect 手势识别之挥手（C++实现）
香樟依旧: 博主你好这个需要的环境是什么能直接用吗还是要下载Kinect SDK
C++ 二级指针和二维数组
夜晚不懂天的白: 然而如果cp 是二级指针，即上述代码中的p，则编译器对 p[0][2] 的解码是：首先把 p 当做是一个普通的指针，找到p[0] 的地址（p+0）后，再把 p[0] 里面存放的值 p1 = 0 当做是一个指针，然后在 p1 上进行下一次的寻址：p1[2] 对应的地址是：p1 + 2 .所以最后程序输出的是内存地址：p1 + 2 中存储的值，因为 p1 是一个指针，假设 sizeof p1 = 4,则有 p1+2 = 8（注意指针相加规则），因此 p[0][2] 读取的是地址 0x00000008 上面的值。真心没看懂你一会p,一会p1,搞不懂你在说什么.
加州理工学院公开课：机器学习与数据挖掘_过拟化（第十一课）
_HAIL_ 回复飞天狐213: youtebe上有链接： https://www.youtube.com/watch?v=mbyG85GZ0PI
加州理工学院公开课：机器学习与数据挖掘_过拟化（第十一课）
_HAIL_ 回复 abcabsd: youtebe上有链接： https://www.youtube.com/watch?v=mbyG85GZ0PI
加州理工学院公开课：机器学习与数据挖掘_过拟化（第十一课）
_HAIL_ 回复 likun_dd: youtebe上有链接： https://www.youtube.com/watch?v=mbyG85GZ0PI

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。