分类（Datawhale X 李宏毅苹果书 AI夏令营）

最新推荐文章于 2024-10-02 00:23:27 发布

会飞的Anthony

最新推荐文章于 2024-10-02 00:23:27 发布

阅读量948

点赞数 24

分类专栏：信息系统人工智能机器学习文章标签：人工智能机器学习分类

本文链接：https://blog.csdn.net/ljd939952281/article/details/141470768

版权

人工智能同时被 3 个专栏收录

164 篇文章 3 订阅

订阅专栏

信息系统

131 篇文章 0 订阅

订阅专栏

机器学习

44 篇文章 0 订阅

订阅专栏

分类与回归的关系

在机器学习中，分类问题和回归问题是两种基本的任务类型。分类问题的目标是将输入数据分配到预定义的类别中，而回归问题则预测连续的数值。尽管这两者在目标和输出表示上存在差异，但它们之间有着密切的关系。特别地，分类问题可以被视为回归问题的一种扩展。例如，可以通过将分类问题视为回归问题来处理，通过预测类别的概率分布来完成分类任务。这种方法使得分类问题可以使用回归技术和工具进行分析。

数字表示类别的问题

在处理分类问题时，直接使用数字编号表示类别可能导致模型误解类别之间的关系。例如，如果用数字0、1、2分别表示“猫”、“狗”和“兔子”，模型可能会错误地认为这些类别之间存在某种顺序关系或距离，这在实际问题中通常是不正确的。这种误设可能影响模型的训练效果和预测准确性。

独热编码的使用

独热编码（One-Hot Encoding）是一种常用的类别表示方法，它可以有效解决类别关系预设的问题。在独热编码中，每个类别被表示为一个二进制向量，其中每个类别对应一个位置，只有该类别的位置为1，其余位置为0。这样可以确保模型不会误解类别之间的关系。例如，“猫”可以表示为[1, 0, 0]，“狗”表示为[0, 1, 0]，“兔子”表示为[0, 0, 1]。独热编码将类别信息转化为数值格式，避免了类别之间的顺序误设，方便了模型的训练和预测。

网络多个输出的示例

在深度学习中，分类网络通常产生多个输出值，每个输出值对应于一个类别。例如，对于一个三分类问题，网络的输出层可能包含三个节点，每个节点的输出值表示对应类别的预测概率。通过这种方式，网络能够同时处理多个类别，并提供每个类别的预测概率。

带有softmax的分类

在处理分类问题时，softmax函数是一种常用的激活函数，它将网络的输出转换为概率分布。softmax函数的公式为：