MOOC机器学习（浙大课程）第一章

最新推荐文章于 2023-08-19 04:20:59 发布

魔法少女竹千代

最新推荐文章于 2023-08-19 04:20:59 发布

阅读量2.3k

点赞数 6

分类专栏：自学文章标签：机器学习

本文链接：https://blog.csdn.net/qq_43541776/article/details/117414018

版权

自学专栏收录该内容

32 篇文章 15 订阅

订阅专栏

MOOC机器学习（浙大课程）第一章：引言

笔记
测试

笔记

机器学习(Machine Learning)：
第一个定义：机器学习是这样的领域，它赋予计算机学习的能力，（这种学习能力）不是通过显著式编程获得的。
第二个定义：一个计算机程序被称为可以学习，是指它能够针对某个任务T和某个性能指标P，从经验E中学习。这种学习的特点是，它在T上的被P所衡量的性能，会随着经验E的增加而提高
机器学习算法：按照任务是否需要和环境交互获得经验，将机器学习分为监督学习和强化学习。
（1）监督学习：
传统的监督学习：每一个训练数据都有对应的标签。包括：支持向量机、人工神经网络、深度神经网络
非监督学习：所有训练数据都没有对应的标签（聚类、EM算法、主成分分析）
半监督学习：训练数据中一部分有标签，一部分没有标签
将监督学习分为分类和回归，其中分类的标签的离散的值，回归的标签是连续的值
（2）强化学习
机器学习算法过程：机器学习的重点是假设在已经提取好特征的前提下，如何构造算法获得更好的性能。
第一步：提取特征(Feature Extraction)，指通过训练样本获得的，对机器学习任务有帮助的多维度数据。
第二步：不同的算法对特征空间做不同的划分
第三步：获得不同的结果
研究不同的应用场景下应该采取哪种算法，并研究新的机器学习算法以便适应新的场景。
没有免费午餐定理(No Free Lunch Theorem)
任何一个预测函数，如果在一些训练样本上表现好，那么必然在另一些训练样本上扁平线不好，如果不对数据在特征空间的先验分布有一定假设，那么表现好与表现不好的情况一样多。
没有任何情况下都最好的机器学习算法。
在设计机器学习算法的时候有一个假设：在特征空间上距离接近的样本，他们属于同一个类别的概率会高。