机器学习问题的简单介绍

最新推荐文章于 2023-04-12 21:09:20 发布

飘逸py

最新推荐文章于 2023-04-12 21:09:20 发布

阅读量221

点赞数

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/sjq_915/article/details/108422828

版权

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

对于一个完整的机器学习问题，一般包括以下五个部分：

样本模型训练测试推理

样本是去抽取知识的依据。机器学习并不是盲目的进行推理，通常会根据已知的内容来抽取一些客观的的规律，然后根据这些规律去进行进一步的推理和预测，而这些规律是通过样本挖掘出来的。样本通常包括两个部分：属性和标签。属性可以理解为是对样本的描述，比如，对于一个“人”，他的皮肤是黄色的，眼睛是黑色的，另外一个“人”的皮肤是白色的，眼睛是蓝色的，通过不同颜色皮肤和眼睛这样的属性来描述这个人，而标签则是指带有这种属性的人是黄种人还是白种人，这里的黄种人、白种人就是对应样本的类别。标签可以是离散的值，也可以是连续的值。对于一个样本而言，它的属性描述了样本本身的一些性质，标签则是对这个样本的归类。而对于一个函数：

$y = f\left ( x \right )$

这个函数的输入是x，输出是y。属性就是其中的x，标签则是y。若已知x和y，则可以对x和y进行建模。这里的模型其实指的就是f这个函数，用来描述x与y之间的关系。训练指的就是从样本中学习得到这个模型的过程。比如：

f(x) = ax + b

训练的过程其实就是求a和b的过程。通过训练的方法可以获取模型的参数，有了参数后，就可以对当前的这个模型进行测试和评价。测试的过程其实就是评价模型的过程。比如通过一种机器学习的算法获取到了一组模型参数，此时并不知道有没有其它方法求解出来的模型比当前的模型预测出来的效果要好，要想知道模型的好坏则需要通过一套测试的方法来评价这个模型。通过测试能够完成对一个模型性能的评估，如果性能还不错，我们就得到了f(x)这个函数。此时，拿到一组只有属性而没有标签的样本，我们就可以通过f(x)这个函数对当前样本进行预测，获取到这个样本的标签。其中，预测的过程就是获取标签的过程。