杂记-分类与回归

lxznjw

已于 2023-06-29 17:36:48 修改

阅读量160

点赞数

分类专栏：其他文章标签：分类回归数据挖掘

于 2023-06-28 08:44:08 首次发布

本文链接：https://blog.csdn.net/qq_40140808/article/details/131429113

版权

7 篇文章

订阅专栏

分类和回归是机器学习中两种不同的任务，其主要区别在于目标变量的性质和预测结果的类型。

分类任务的预测结果是样本属于哪个类别的概率或决策。例如，对于图像分类任务，模型可能输出一张图像属于猫的概率为0.8，属于狗的概率为0.2。或者模型直接输出"猫"或"狗"的决策结果。
回归任务的预测结果是一个连续的数值，可以是实数或整数。例如，对于房屋价格预测任务，模型可能输出一座房屋的预测价格为100,000美元。
在分类和回归任务中，常用的代价函数（也称为损失函数）和评估函数有一些不同。

对于分类任务，常见的代价函数和评估函数包括：

代价函数：
- 交叉熵损失函数（Cross-Entropy Loss）：用于多分类问题，衡量预测类别与真实类别之间的差异。
- 对数损失函数（Log Loss）：用于二分类问题，衡量预测概率与真实标签之间的差异。
- Hinge损失函数（Hinge Loss）：用于支持向量机（SVM）等分类器，衡量预测结果与真实标签之间的差异。
- 其他常见的代价函数还包括均方误差（Mean Squared Error）、平均绝对误差（Mean Absolute Error）等。
评估函数：
- 准确率（Accuracy）：计算分类模型预测结果中正确分类的样本比例。
- 精确率（Precision）：衡量正例预测的准确性，即预测为正例的样本中真正为正例的比例。
- 召回率（Recall）：衡量正例被预测出的能力，即真正为正例的样本中被预测为正例的比例。
- F1分数（F1 Score）：综合考虑精确率和召回率，用于平衡二者之间的关系。
- ROC曲线和AUC值（Receiver Operating Characteristic curve and Area Under Curve）：用于评估二分类模型在不同阈值下的性能。

对于回归任务，常见的代价函数和评估函数包括：

代价函数：
- 均方误差（Mean Squared Error）：衡量预测值与真实值之间的差异。
- 平均绝对误差（Mean Absolute Error）：衡量预测值与真实值之间的绝对差异。
- Huber损失函数：综合了均方误差和平均绝对误差，对离群点具有一定的鲁棒性。
评估函数：
- R平方（R-Squared）：衡量模型对目标变量的解释能力，取值范围为0到1，越接近1表示模型拟合效果越好。

需要根据具体的任务和算法选择合适的代价函数和评估函数，以便衡量模型的性能和进行模型的训练和评估。

总结：