机器学习概念：监督学习、无监督学习、回归、聚类

最新推荐文章于 2025-11-21 15:09:22 发布

原创最新推荐文章于 2025-11-21 15:09:22 发布 · 3.3k 阅读

CC 4.0 BY-SA版权

文章标签：

41 篇文章

订阅专栏

31 篇文章

订阅专栏

本文介绍了机器学习中的监督学习和无监督学习。监督学习含分类和回归任务，分类将输入数据分入预定义类别，回归预测连续数值输出；无监督学习有聚类、降维等任务，聚类是将样本分组。还阐述了分类、回归、聚类任务的目标、解决步骤及常见算法。

监督学习（Supervised Learning）：
- 在监督学习中，训练数据包含了输入特征，和相应的标签（目标值）。
- 监督学习的目标是学习一个从输入到输出的映射，使得模型能够根据输入预测相应的输出。
- 典型的监督学习任务包括分类任务和回归任务。
- 在分类任务中，目标是将输入数据分为不同的类别，例如图像识别中将图像分类为猫、狗等。
- 在回归任务中，目标是预测连续数值型的输出，例如房价预测中预测房屋价格。
无监督学习（Unsupervised Learning）：
- 在无监督学习中，训练数据只包含输入特征，没有相应的标签或目标值。
- 无监督学习的目标是从数据中发现潜在的结构或模式，而无需事先给定标签。
- 典型的无监督学习任务包括聚类、降维、异常检测等。
- 在聚类任务中，目标是将数据集中的样本分组到不同的簇中，使得同一簇内的样本相似度较高。
- 在降维任务中，目标是减少数据集的维度，同时保留数据集中的重要信息。
- 在异常检测任务中，目标是识别数据集中的异常样本或异常模式。

3.分类：

分类是监督学习中的一种任务，其目标是将输入数据分配到预定义的类别或标签中。在分类问题中，每个样本都有一个标签，模型的任务是学习从输入特征到输出标签的映射关系。

分类问题通常可以分为两类：

二分类（Binary Classification）：
- 在二分类问题中，每个样本只能被分配到两个互斥的类别中的一个。
- 典型的例子包括垃圾邮件检测（垃圾邮件或非垃圾邮件）、癌症诊断（恶性或良性）等。
多分类（Multi-class Classification）：
- 在多分类问题中，每个样本可以被分配到多个类别中的一个。
- 典型的例子包括手写数字识别（数字 0 到 9）、图像分类（动物分类、物体分类等）等。