机器学习--混淆矩阵

1.模型优缺点比较:

模型优缺点比较

2.信息熵:

信息熵是信息的期望值,描述信息的不确定度。一个系统越是有序,信息熵就越低;反之,一个系统越是混乱,它的信息熵就越高。
计算公式:
信息熵计算公式

3.信息增益:

表示得知特征X的信息而使得类Y的信息的不确定性减少的程度
计算公式:

infoGain = baseEntropy - EntropyAfter

当infoGain > 0 ,表明集合信息熵减小,包含的信息更纯更有序,价值得到提高。
当infoGain < 0,信息变得混沌。
当infoGain = 0,信息量没有变化,但不表明信息没有变化。

4.混淆矩阵

真阳性(True Positive,TP):样本的真实类别是正例,并且模型预测的结果也是正例
真阴性(True Negative,TN):样本的真实类别是负例,并且模型将其预测成为负例
假阳性(False Positive,FP):样本的真实类别是负例,但是模型将其预测成为正例
假阴性(False Negative,FN):样本的真实类别是正例,但是模型将其预测成为负例

from sklearn.metrics import confusion_matrix
confusion_matrix = confusion_matrix(y_test, y_predict)

混淆矩阵
准确率(accuracy):预测正确的结果占总样本的百分比
准确率
召回率(recall):在实际为正的样本中被预测为正样本的概率
召回率
精准率(precision):
精准率
F1值(调和平均值):
F1值

from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score

print('准确率:', accuracy_score(y_test, y_hat))
print('精确率:', precision_score(y_test, y_hat))
print('召回率:', recall_score(y_test, y_hat))
print('F1调和平均值:', f1_score(y_test, y_hat))
print('score方法计算正确率:',lr.score(x_test, y_test))
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值