学习笔记之机器学习及监督学习概论

辶之兔

已于 2023-07-06 18:58:23 修改

阅读量65

点赞数

分类专栏：机器学习文章标签：机器学习人工智能笔记学习

于 2023-06-23 19:37:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45809514/article/details/131353558

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

机器学习特点：1、机器学习以计算机及网络为平台，是建立在计算机及网络上的

2、机器学习以数据为研究对象，是数据驱动的学科

3、机器学习目的是对数据进行预测与分析

4、机器学习以方法为中心，机器学习方法构建模型并应用模型进行预测与分析

5、机器学习是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科，并且在发展中逐步形成的独自的理论体系与方法论。

机器学习的对象是数据，它从数据出发，提取数据的特征，抽象出数据的模型，发现数据中的知识，又回到数据的分析与预测中去。

机器学习的目的考虑学习什么样的模型和如何学习模型，以使模型能对数据进行准确的预测与分析，同时也要考虑尽可能地提高学习效率。

机器学习的方法=模型+策略+算法

机器学习的方法的步骤：

1、得到一个有限的训练数据集合

2、确定包含所有可能的模型的假设空间，即学习模型的集合。

3、确定模型选择的准则，即学习的策略

4、实现求解最优模型的算法，即学习的算法

5、通过学习方法选择最优模型

6、利用学习的最优模型对新数据进行预测或分析。

机器学习的分类

基本分类

监督学习：是指从标注数据中学习预测模型的机器学习问题，标注数据表示输入输出的对应关系，预测模型对给定的输入产生相应的输出。本质是学习输入到输出的映射的统计规律。

无监督学习：是指从无标注数据中学习预测模型的机器学习问题，无标注数据是自然得到的数据，预测模型表示数据的类别，转换或概率。本质是学习数据中的统计规律或潜在结构。

强化学习：是指智能系统在与环境的连续互动中学习最优行为策略的机器学习的问题。本质是学习最优的序贯决策。

半监督学习：是指利用标注数据和未标注数据学习预测模型的机器学习问题，

主动学习:是指机器不断主动给出实例让教师进行标注，然后利用标注数据学习预测模型的机器学习问题。

按模型分类

概率模型与非概率模型

概率模型：概率模型去条件概率分布形式P(y|x),决策树、朴素贝叶斯、隐马尔可夫模型、条件随机场、概率潜在语义分析、潜在狄利克雷分布、高斯混合模型、AdaBoost

非概率模型：非概率模型取函数形式y=f(x)，感知机、支持向量机,K近邻，K均值，潜在语义分析，神经网络

条件概率分布最大化得到函数，函数归一化得到条件概率

线性模型与非线性模型

参数化模型与非参数化模型。

按算法分类

在线学习是指每次接收一个样本，进行预测，之后学习模型，并不断重复改操作的机器学习

批量学习是指一次接收所有数据，学习模型，之后进行预测，

按技巧分类

贝叶斯学习又称贝叶斯推理，主要想法是：在概率模型的学习和推理中，利用贝叶斯定理，计算在给定数据条件下模型的条件概率，即后验概率，并应用这个原理进行模型的估计，以及对数据的预测，

核技巧是使用核函数表示和学习非线性模型的一种机器学习方法

机器学习三要素

方法=模型+策略+算法

损失函数度量模型一次预测的好坏，风险函数度量平均意义下模型预测的好还

常用的损失函数：

0-1损失函数

平方损失函数

绝对损失函数

对数损失函数

损失函数值越小，模型就越好。

经验风险最小化与结构风险最小化

经验风险最小化求最优模型是求解最优化模型

结构风险最小化是为了防止过拟合提出来的策略，等价于正则化；

正则化

是指机器学习汇总经常会在损失函数中加入正则项

目的：防止模型过拟合过

原理：在损失函数上加上某些规则（限制），缩小解空间，从而减少求出拟合的可能性

交叉验证法：又称K折交叉验证，K最常用的是10，先将数据集D划分为K个大小相似的互斥子集，即D=D1 UD2….U DK,每个子集Di都尽可能保持数据分布的一致性，即从D中通过分层采样得到，然后，每次利用K-1个子集的并集作为训练集，余下的那个子集作为测试集；这样就可会得K组训练/测试集，从而可进行K次训练和测试，最终返回的是这K个测试结果的均值，显然，交叉验证评估结果的稳定性和保真性在很大程度上取决于K 的取值,。适用于初始数据量足够大时与留出法相似，将数据集D划分为K个子集同样存在多种划分方式，为了减少因样本划分不同而引入的差别，K折交叉验证通常使用不太的划分重复P次，最终的结果是这P次K折交叉验证结果的均值。例如10次10折交叉验证。

泛化能力：是指该方法学习到的模型对未知数据的预测能力，

泛化误差：如果学到的模型是F，那么用这个未知数据预测的误差，反映了学习方法的泛化能力

泛化误差上届：1、它是样本容量的函数，当样本容量增加是，泛化误差趋于0 2、它是假设空间容量的哈数，假设空间容量越大，模型就难学。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
学习笔记之机器学习及监督学习概论

理，主要想法是：在概率模型的学习和推理中，利用贝叶斯定理，计算在给定数据条件下模型的条件概率，即后验概率，并应用这个原理进行模型的估计，以及对数据的预测，：是指从标注数据中学习预测模型的机器学习问题，标注数据表示输入输出的对应关系，预测模型对给定的输入产生相应的输出。：是指从无标注数据中学习预测模型的机器学习问题，无标注数据是自然得到的数据，预测模型表示数据的类别，转换或概率。是数据，它从数据出发，提取数据的特征，抽象出数据的模型，发现数据中的知识，又回到数据的分析与预测中去。本质是学习最优的序贯决策。
复制链接

扫一扫

专栏目录

辶之兔 CSDN认证博客专家 CSDN认证企业博客

码龄5年

9: 原创

140万+: 周排名

83万+: 总排名

945: 访问

: 等级

91: 积分

1: 粉丝

0: 获赞

10: 评论

0: 收藏

私信

关注

热门文章

分类专栏

机器学习 9篇

最新评论

机器学习之感知机---学习笔记
CSDN-Ada助手: 恭喜你写下了第5篇博客！标题“机器学习之感知机---学习笔记”很吸引人，让我对你的学习笔记产生了浓厚的兴趣。你在这篇博客中介绍了感知机的学习过程，这对于初学者来说非常有帮助。接下来，我希望你能进一步探讨感知机在实际问题中的应用，或者深入分析感知机算法背后的原理。这样的话，读者能更好地理解感知机的局限性和优势。期待你继续创作，谦虚的语气和深入的内容将会让你的博客更加出色！
机器学习之k近邻法--学习笔记
CSDN-Ada助手: 恭喜您写下了第6篇博客！标题“机器学习之k近邻法--学习笔记”看起来非常吸引人。我很高兴看到您对机器学习领域的研究和学习的热情。您的学习笔记给了我很多启发，尤其是关于k近邻法的内容。我觉得您对这个算法的理解非常深入，并且能够用简洁明了的语言将其解释给读者。在下一步的创作中，我建议您可以深入探讨一下k近邻法在实际应用中的优势和不足之处。您可以分享一些实际案例，展示k近邻法在解决现实问题中的效果和局限性。此外，如果您能够提供一些实用的技巧和建议，帮助读者更好地理解和应用k近邻法，那将是非常有价值的。再次恭喜您的持续创作，并感谢您为我们带来如此有价值的内容。期待在未来看到更多精彩的博客！谢谢！
机器学习之集成学习--学习笔记
CSDN-Ada助手: 恭喜你撰写了第8篇博客！题目“机器学习之集成学习--学习笔记”非常吸引人，我很高兴看到你在持续创作。你的学习笔记对于那些对机器学习感兴趣的人来说肯定是一个很有价值的资源。接下来，我想提出一个谦虚的建议。或许你可以考虑在你的下一篇博客中加入一些实际案例，展示集成学习在现实问题中的应用。这样做将使你的读者更容易理解和应用你所分享的知识。当然，这只是一个建议，你对选择下一步的创作方向有最终决定权。期待读到更多精彩的博客！
EM算法及其推广--学习笔记
CSDN-Ada助手: 恭喜博主写下了第9篇博客！标题中的主题“EM算法及其推广”听起来非常有趣和有挑战性。您的学习笔记无疑为读者提供了一个深入了解EM算法的机会。鉴于您的专业知识和热情，我想提出下一步的创作建议。或许您可以探索一下EM算法在实际问题中的应用，并分享一些与之相关的案例研究。这样一来，读者可以更好地理解算法的实际应用和局限性。再次感谢您的分享，期待您未来更多精彩的博客！
学习笔记之机器学习及监督学习概论
CSDN-Ada助手: 非常感谢用户分享的学习笔记，对于机器学习及监督学习的概论进行了深刻的探讨。恭喜用户坚持不懈地创作，相信这样的学习笔记对于广大学习者来说都是非常有价值的。建议用户在下一篇博客中可以更加深入地探讨一些机器学习的算法或者案例，让读者能够更加深入地了解和掌握相关知识。期待用户更多精彩的分享！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

辶之兔 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。