混淆矩阵(Confusion matrix)的原理及使用(scikit-learn 和 tensorflow)

最新推荐文章于 2024-10-16 19:00:39 发布

光英的记忆

最新推荐文章于 2024-10-16 19:00:39 发布

阅读量5.7k

点赞数

分类专栏： NLTK sklearn 文章标签： sklearn

本文链接：https://blog.csdn.net/qq_29678299/article/details/90577419

版权

本文介绍了混淆矩阵的概念，它在机器学习中用于评估模型性能，特别是分类任务。混淆矩阵是一个(n_classes,n_classes)的方阵，展示了真实类别与预测类别的对应情况。文章详细阐述了在scikit-learn和Tensorflow中如何使用confusion_matrix API，并给出了示例。" 124238837,8513676,Postman接口测试：利用外部CSV实现参数化,"['接口测试', 'Postman']

摘要由CSDN通过智能技术生成

原理

　　在机器学习中, 混淆矩阵是一个误差矩阵, 常用来可视化地评估监督学习算法的性能. 混淆矩阵大小为 (n_classes, n_classes) 的方阵, 其中 n_classes 表示类的数量. 这个矩阵的每一行表示真实类中的实例, 而每一列表示预测类中的实例 (Tensorflow 和 scikit-learn 采用的实现方式). 也可以是, 每一行表示预测类中的实例, 而每一列表示真实类中的实例 (Confusion matrix From Wikipedia 中的定义). 通过混淆矩阵, 可以很容易看出系统是否会弄混两个类, 这也是混淆矩阵名字的由来.

　　混淆矩阵是一种特殊类型的列联表(contingency table)或交叉制表(cross tabulation or crosstab). 其有两维 (真实值 "actual" 和预测值 "predicted" ), 这两维都具有相同的类("classes")的集合. 在列联表中, 每个维度和类的组合是一个变量. 列联表以表的形式, 可视化地表示多个变量的频率分布.