机器学习的分类

奇睿海

于 2024-05-02 13:36:39 发布

阅读量46

点赞数 23

分类专栏：大模型文章标签：机器学习分类人工智能

本文链接：https://blog.csdn.net/weixin_49146002/article/details/138333051

版权

大模型专栏收录该内容

14 篇文章 0 订阅

订阅专栏

机器学习主要分为有监督学习、无监督学习、半监督学习和强化学习。

有监督学习

有监督学习是机器学习的一种范式，其中模型从带有标签的训练数据中学习预测目标变量的映射关系。在有监督学习中，每个训练样本都包括一个输入特征向量和一个对应的标签（或目标），模型的任务是通过学习从输入到输出的映射关系来预测未知输入的输出标签。

具体来说，有监督学习包括两种类型的任务：

分类（Classification）： 在分类任务中，模型的目标是将输入样本分配到预定义的类别中。例如，给定一张图片，模型可以预测该图片中的物体是猫还是狗，这是一个二分类问题；或者将电子邮件分类为垃圾邮件或非垃圾邮件，这是一个多分类问题。
回归（Regression）： 在回归任务中，模型的目标是预测连续数值型的输出变量。例如，给定一个房屋的特征（如面积、卧室数量等），模型可以预测该房屋的销售价格。

在有监督学习中，训练数据通常由大量的带有标签的样本组成，模型通过最小化预测值与实际标签之间的差异（即损失函数）来学习。训练过程通常包括将数据分为训练集和验证集，用训练集训练模型，然后用验证集评估模型的性能。最终，模型可以用来对未见过的数据进行预测。

举例来说，假设我们有一个简单的分类任务：根据两个特征（例如花瓣长度和花瓣宽度），将鸢尾花分为三个类别之一：山鸢尾、变色鸢尾或维吉尼亚鸢尾。我们收集了一些已经被专家标记的鸢尾花数据，每个样本都包括花瓣长度和花瓣宽度的测量值以及该花的种类（标签）。

让我们看看一个简化的示例：

花瓣长度	花瓣宽度	类别
5.1	3.5	山鸢尾
4.9	3.0	山鸢尾
6.7	3.1	维吉尼亚鸢尾
…	…	…

在这个示例中，每一行代表一个鸢尾花样本，包括花瓣长度和花瓣宽度的测量值以及该花的类别（山鸢尾、变色鸢尾或维吉尼亚鸢尾）。这些标签是我们已经知道的真实类别，因此我们可以使用这些数据来训练一个有监督学习模型。

一旦我们拥有了足够的训练数据，我们可以使用各种分类算法（如逻辑回归、决策树、支持向量机等）来训练模型。训练过程中，模型会尝试找到一个可以最好地将输入特征与输出标签关联起来的映射。训练完成后，我们就可以使用这个模型来对新的、未见过的鸢尾花样本进行分类预测，根据其花瓣长度和花瓣宽度来预测其所属的鸢尾花类别。

总的来说，有监督学习是一种通过训练数据中的已知输入和输出之间的关系来学习模型的方法，是机器学习中最常见和基础的学习范式之一。