3.6 固定基函数的局限性(PRML读书笔记)

本节小结

  3.1-3.5节介绍了由固定基函数的线性组合组成的回归模型,这样的模型具有⼀些有⽤的分析性质和计算性质。此外,对于⼀个合适的基函数集的选择,我们可以建⽴输⼊向量到⽬标值之间的任意⾮线性映射(功能还是挺强大的)。但是它们的实际应⽤被维数灾难问题(维度灾难详见1.4节)限制了,这是因为基函数要事先固定下来,并且随着输⼊空间的维度D迅速增长,通常是指数⽅式的增长(如果函数的数量远低于输入空间的维度D,会带来维度降低,所以基函数的数量需要随着输⼊空间的维度D增长)。
  幸运的是,真实数据集有两个性质,可以帮助我们缓解这个问题。

  • 第⼀,数据向量{ x n \textbf{x}_n xn}通常位于⼀个⾮线性流形内部。由于输⼊变量之间的相关性,这个流形本⾝的维度⼩于输⼊空间的维度(第12章中讨论⼿写数字识别时给出⼀个例⼦来说明这⼀点)。如果我们使⽤局部基函数,那么我们可以让基函数只分布在输⼊空间中包含数据的区域(特别注意,这里说的是局部基函数,因为全局基函数会对所有输入空间造成影响)。这种⽅法被⽤在径向基函数⽹络中,也被⽤在⽀持向量机和相关向量机当中。神经⽹络模型使⽤可调参的基函数,使得输⼊空间的区域中基函数会按照数据流形发⽣变化。(看完5-7章之后再理解本段,理解什么是非线性流形、神经网络和核方法是如何适应非线性流行的特点的。)。
  • 第⼆,⽬标变量可能只依赖于数据流形中的少量可能的⽅向(这里的方向是什么意思)。利⽤这个性质,神经⽹络可以通过选择输⼊空间中基函数产⽣响应的⽅向。

互动话题

  • 维度灾难到底是当高维空间时需要太多的样本(样本数目必须大于决策区间数目)(如1.4和《深度学习》5.11节提到的),还是仅仅本节提到的会导致函数模型(如线性模型)太复杂?
    结合本书1.4和《深度学习》5.11节提到的,目前的理解:任何机器学习算法都会利用局部不变性。但是线性模型没有有效利用“数据非线性流行”的特点,使得函数模型过于复杂。核方法利用了“数据非线性流行”的特点,但是“样本数目必须大于决策区间数目”的问题并没有解决。神经网络不仅利用了“数据非线性流行”的特点,也解决了“样本数目必须大于决策区间数目”的问题。
  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
PRML(模式识别与机器学习)算法的Matlab实现是指使用Matlab编程语言实现PRML书中提到的各种算法和模型。PRML算法是一种广义的模型学习算法,可以用于模式识别、机器学习和数据挖掘等问题。 PRML算法的Matlab实现可以包括以下内容: 1. 数据预处理:对原始数据进行清洗、归一化、特征提取等预处理操作,为后续模型训练做准备。 2. 模型选择:根据具体问题选择适当的模型,包括朴素贝叶斯、支持向量机、决策树、聚类分析等算法。 3. 参数估计:使用PRML中介绍的最大似然估计、贝叶斯估计等方法,通过训练数据得到模型的参数估计。 4. 模型训练:使用已估计得到的模型参数,对训练数据进行训练,得到最优的模型。 5. 模型评估:对训练得到的模型进行评估,使用评价指标如准确率、召回率、F1值等来判断模型性能。 6. 模型预测:使用训练得到的模型对新的未知数据进行预测,得到相应的结果。 在Matlab中,可以使用相关的函数和工具箱来实现PRML算法,例如Statistics and Machine Learning Toolbox、Pattern Recognition Toolbox等。这些工具箱提供了各种算法和模型的实现函数,也提供了数据处理、评估和预测的函数,方便开发者实现PRML算法。 实现PRML算法的Matlab代码需要具备一定的编程能力和数学础,了解相关的算法原理和数学推导。可以通过阅读PRML书籍中的算法推导、Matlab官方文档和相关学术论文等资源,来学习和理解PRML算法的Matlab实现。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值