机器学习模型结果，合理使用

最新推荐文章于 2023-10-23 17:01:32 发布

生信补给站

最新推荐文章于 2023-10-23 17:01:32 发布

阅读量745

点赞数 1

分类专栏：数据挖掘模型文章标签：机器学习数据挖掘模型评价

本文链接：https://blog.csdn.net/weixin_39556044/article/details/103140757

版权

本文探讨了机器学习模型的评估方法，包括分类算法的准确率、混淆矩阵、精准率、召回率、F1 Score和ROC曲线。强调在数据偏斜的情况下，单纯依赖准确率是不够的，应当结合混淆矩阵和其他指标，如F1 Score和AUC，以全面评估模型性能。

摘要由CSDN通过智能技术生成

机器学习算法结合生信分析很多，作为非算法专业人士，根据模型得到的结论，敢用吗？

又有哪些模型评估方法可以是我们用的稍微放心一点呢？

本文主要从以下两个模型类别来介绍：

分类模型预测是否患有癌症的准确度99.9%，哇好高，那这个模型是不是就是很好呢？

假如癌症产生的概率是0.1%，那即使“傻瓜式”的预测所有人都是健康的，就可达到99.9%的准确率。

也就是说对于极度偏斜的数据，只使用分类准确度不行。此时就需要使用混淆矩阵(Confusion Matrix)做进一步分析。

对于二分类问题来说，所有的问题被分为0和1两类，混淆矩阵是2*2的矩阵：

	预测值0	预测值1
真实值0	TN	FP
真实值1	FN	TP

关注