【0】机器学习

最新推荐文章于 2024-07-26 13:57:53 发布

星宇痕

最新推荐文章于 2024-07-26 13:57:53 发布

阅读量399

点赞数

分类专栏：未分类

本文链接：https://blog.csdn.net/qq_40822405/article/details/89439913

版权

本文介绍了机器学习的基本概念，包括TPE（Trial-Error Process of Experimentation）定义，学习类型如有监督、无监督学习，以及机器学习的四个关键组成部分：数据集、模型、目标函数和优化方法。讨论了数据集的重要性，模型作为输入和输出之间映射的关系，以及如何通过目标函数和优化方法来衡量和改进模型性能。作者分享了自己的学习历程和资源，强调了实践中不断学习和修正的重要性。

摘要由CSDN通过智能技术生成

TPE定义

偷个懒，直接上图：
TPE
　　用自己的话来说就是通过对经验的学习机器在某项任务上干得越来越好（性能更高）。

学习类型

根据样本和标签的情况分为以下四类：

样本	标签	类型
有	有	有监督学习
有	无	无监督学习
有	少量有+大量无	半监督学习
无	\	强化学习

回归和分类都是有监督学习，聚类是无监督学习。这里不多讲，网上有很多资料。

组成部分

花书里的概念，觉得很精辟。4-21学完线性回归和逻辑回归，用上这个概念，化繁为简，good！

数据集

常言道：好的数据往往比算法更为重要。的确，数据是机器用来学习的经验，如果经验本身蕴含的规律就是不完整甚至不正确的，怎么能期待机器在未知的样本中给出正确的结果呢？
　　一个数据集有两部分：训练集（train）和测试集（test），训练集是让机器学习规律的，测试集是评价机器学习效果的。感觉有点像学生做的习题和考试题，对应的——我们更关心机器在测试集上的表现而不是在训练集上的表现。

模型

这部分就是我们真正要用的东西了，负责接收数据也就是特征，然后经过运算，输出结果，比如回归值，类别等。所谓模型，就是一个函数，表达了输入和输出之间的映射关系。
　　一开始怎么都搞不懂，训练了那么多轮，到底干啥了？其实就是在训练这个模型，这个模型的参数就是我们要训练的内容。
　　不同参数下模型表现会有很大不同，可能极