【sklearn报错解决方案】UndefinedMetricWarning: Precision is ill-defined and being set to 0.0

最新推荐文章于 2025-03-15 19:15:11 发布

原创最新推荐文章于 2025-03-15 19:15:11 发布

· 2w 阅读

35 ·

版权

原创博客归本人所有，禁止任何人、组织、公司转载或采集！

文章标签：

#sklearn #机器学习 #python #精确率 #precision_score

理论基础专栏收录该内容

40 篇文章

订阅专栏

本文深入探讨了在使用sklearn.metrics.precision_score计算精确率时遇到的`UndefinedMetricWarning`警告。精确率计算涉及预测正确标签的比例，当预测标签全为0时会导致除数为0的错误。示例展示了不同数据情况下精确率的计算，包括全0预测标签的情况。解决方法是直接忽略警告，因为在一个较大的batch_size中，个别样本精确率为0对整体影响较小。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

出错描述

使用sklearn.metrics.precision_score计算精确率时，出现报错：UndefinedMetricWarning: Precision is ill-defined and being set to 0.0 in samples with no predicted labels.

问题原理分析

精确率计算的是所有样本的平均精确率。而对于每个样本来说，精确率就是预测正确的标签数在整个预测为正确的标签数中的占比。其计算公式为：
在这里插入图片描述

例如对于某个样本来说，其真实标签为[0, 1, 0, 1]，预测标签为[0, 0, 0, 0]。那么该样本对应的精确率就应该为：（0 + 1 + 0 + 0） / （0 + 0 + 0 + 0），这时就会报错。

情况一

假设有数据：样本数batch_size = 5，标签数label_num = 4。y_true为真实标签，y_pred为预测标签值。

y_true = np.array([[0, 1, 0, 1],
                   [0, 1, 1, 0],
                   [0, 0, 1, 0],
                   [1, 1, 1, 0],
                   [1, 0, 1, 1]])

y_pred = np.array([[0, 1, 1, 0],
                   [0, 1, 1, 0],
                   [0, 0, 1, 0],
                   [0, 1, 1, 0],
                   [0, 1, 0, 1]])

对照上面给的数据y_true、y_pred。那么该样本对应的准确率就应该为：
$\frac{1}{5} * (\frac{1}{2} + \frac{2}{2} + \frac{1}{1} + \frac{2}{2} + \frac{1}{2})= 0.8$

情况二

假设数把y_pred的某一行改为全0，数据如下。

y_true = np.array([[0, 1, 0, 1],
                   [0, 1, 1, 0],
                   [0, 0, 1, 0],
                   [1, 1, 1, 0],
                   [1, 0, 1, 1]])

y_pred = np.array([[0, 1, 1, 0],
                   [0, 1, 1, 0],
                   [0, 0, 1, 0],
                   [0, 1, 1, 0],
                   [0, 0, 0, 0]])

对照上面给的数据y_true、y_pred。那么该样本对应的准确率就应该为：
$\frac{1}{5} * (\frac{1}{2} + \frac{2}{2} + \frac{1}{1} + \frac{2}{2} + 0)= 0.7$

情况三

假设数把y_pred改为全0，数据如下。

y_true = np.array([[0, 1, 0, 1],
                   [0, 1, 1, 0],
                   [0, 0, 1, 0],
                   [1, 1, 1, 0],
                   [1, 0, 1, 1]])

y_pred = np.array([[0, 0, 0, 0],
                   [0, 0, 0, 0],
                   [0, 0, 0, 0],
                   [0, 0, 0, 0],
                   [0, 0, 0, 0]])

对照上面给的数据y_true、y_pred。那么该样本对应的准确率就应该为：
$\frac{1}{5} * (0 + 0 + 0 + 0 + 0 )= 0.0$

【注】所以如果有除数为0，sklearn中会默认把数值置为0来计算。

解决办法

直接忽略警告即可。

import warnings
warnings.filterwarnings("ignore")

【注】一般一个batch_size都会在32-128，所以有个别样本的精确率为0，最后取平均也还能接收，直接忽略警告就行。