机器学习之评价指标(混淆矩阵、准确度accuracy、精确率precision、召回率recall、F1-score)

一、 模型评价指标

这是我第一次写博客,有什么不足的地方望指正,本文主要讲解建模之后,评价模型的好坏的方法。

混淆矩阵

首先提出四个术语TP、TN、FP、FN

  1. TP(True Positive):预测为正的真实值也为正的样本。
  2. TN(True Negative):预测值为负的真实值也为负的样本。
  3. FP(False Positive):预测值为正的真实值为负的样本。
  4. FN(False Negative):预测值为负的真实值为正的样本。
真实类别
1 0
预测类别 positive TP FP
negative FN TN

准确度(accuracy)

在这里插入图片描述

精确度(precision)

预测值为1且真实值也为1的样本在值为1的所有样本中所占的比例
在这里插入图片描述

召回率(recall)

预测值为1且真实值也为1的样本在预测值为1的所有样本中所占的比例
在这里插入图片描述

F1分数

F1分数(F1 Score)是统计学中用来衡量分类模型精确度的一种指标。它同时兼顾了分类模型的准确率和召回率。F1分数可以看作是模型准确率和召回率的一种加权平均,它的最大值是1,最小值是0,F1分数越接近1,即认为模型效果越好。F1的公式如下所示:
在这里插入图片描述

二、案例(网络入侵自动识别)

导入相关库(python代码)

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.pylab as pylab
import seaborn as sns
from sklearn.metrics import confusion_matrix
from sklearn.metrics import accuracy_score, precision_score, recall_score
from sklearn.metrics import f1_score
from sklearn.metrics import roc_auc_score
from sklearn.model_selection import cross_val_score
from sklearn.tree import export_graphviz
from sklearn.metrics import roc_curve, auc
from sklearn.metrics import classification_report 
from sklearn.ensemble import RandomForestClassifier

加载数据集

# 读取数据
intrusion1= pd.read_csv('net_intrusion_end2.csv', encoding='utf-8',error_bad_lines=False)
# 将数据集随机抽取80%作为训练集20%为测试集
X_train, X_test, y_train, y_test = train_test_split(intrusion1.drop('class.',axis=1), intrusion1['class.'], test_size = .2, random_state=10) 
#决策树
tree = DecisionTreeClassifier(random_state=5)
tree.fit(X_train
  • 0
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值