模式识别与机器学习（一）：概率论、决策论、信息论

最新推荐文章于 2024-02-22 09:30:00 发布

VIP文章 __鸿

最新推荐文章于 2024-02-22 09:30:00 发布

阅读量5k

点赞数 4

分类专栏：机器学习文章标签：机器学习模式识别概率理论决策理论信息论

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014313009/article/details/50756926

版权

本系列是经典书籍《Pattern Recognition and Machine Learning》的读书笔记，正在研读中，欢迎交流讨论。

基本概念

1. 模式识别（Pattern Recognition）：是指通过算法自动发现数据的规律，并进行数据分类等任务。

2. 泛化（generalization）：是指对与训练集数据不同的新样本进行正确分类的能力。（模式识别的主要目标）

3. 分类（classification）：将输入数据分到有限个数的类别中。

4. 回归（regression）：预测输入数据对应的输出值，该输出值由一个或多个连续变量的值组成。

5. 强化学习（reinforcement learning）：在给定的环境或条件下，找到合理的步骤或操作使奖赏最大化。

其特点之一是：在发现新的操作（exploration）和利用现有操作（exploitation）之间进行权衡。

6.线性模型（linear models）：只包含线性的未知参数的模型，例如多项式就是线性模型。

7. RMSE（Root-Mean-Square Error，均方根误差）：观测值与真实值的偏差的平方和与观测次数之比的平方根。（可以反映预测的准确性）

8. 在多项式曲线拟合中，多项式的阶数越高，参数的值也会越高。

当阶数过大时，将导致过拟合，此时参数的值非常大（正值）或非常小（负值），使拟合曲线出现很大的振荡。

解决过拟合的方法之一是：正则化，避免参数值过大或过小。正则化参数（惩罚项）越大，参数值越小。

正则化参数过小，不能解决过拟合问题；正则化参数过大，将导致欠拟合。

9. 优化模型复杂度：使用验证集，交叉验证等等。

概率理论

模式识别中的不确定性（ uncertainty）一方面由于数据集的大小有限，另一方面是由于噪音。

概率规则：

加法规则（sum rule）：

（marginal probability，边缘概率）

乘法规则（product rule）：

（joint probability，联合概率）

1 贝叶斯理论（Bayes's theorem）:

边缘概率可用加法规则计算：

先验概率（prior probability）：某个类发生的概率（主观）。

后验概率（posterior probability）：给定输入数据，其被分到某一类的概率。

最低0.47元/天解锁文章

关注

4
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
模式识别与机器学习（一）：概率论、决策论、信息论

本系列是经典书籍《Pattern Recognition and Machine Learning》的读书笔记，正在研读中，欢迎交流讨论。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。