机器学习 day34(机器学习项目的完整周期、精确度和召回率、F1)

  1. 机器学习项目的完整周期
    在这里插入图片描述
  • 第一步,决定项目是什么。第二步,收集数据。第三步,训练模型,进行错误分析并改进模型,可能会回到第二步。第四步,当模型足够好后,部署在生产环境中,继续监控性能并维护模型,以防性能下降,可能会回到第二步或第三步。
    在这里插入图片描述
  • 部署在生产环境中的常见方法:将模型部署在服务器中,并在应用程序中通过API调用,最后返回模型的预测
  • 根据生产环境是服务于少数几个用户还是几百万个用户,软件工程的需求也有所不同:确保可靠和有效的预测输出,大量用户的扩展,记录用户输入输出数据,系统监控,模型更新等。
  1. 精确度和召回率
    在这里插入图片描述
  • 对于倾斜数据集(正面例子比反面例子不是50:50),我们通常不使用分类错误,而使用其他错误度量(精确度、召回率)来衡量模型的表现
  • 如上图,对于只有0.5%的人患有罕见病的情况,如果我们的模型的分类错误率有1%,而一个只会输出y=0的模型的分类错误率却仅有0.5%,这很明显我们的模型还是能判断出一些罕见病,因此表现要比只会输出y=0的模型要好,但通过分类错误值却不容易判断
    在这里插入图片描述
  • 左图为混淆矩阵,分别将真实分类和预测分类填入矩阵中,四个区域分别为:真阳性(True positive),真阴性(True negative),假阳性(False positive),假阴性(False negative)
  • 精确度为在所有我们预测y=1的例子中,真正为y=1的概率有多少。即 True positive / Predicted Class
  • 召回率为在所有真正为y=1的例子中,我们预测y=1的概率有多少。即True positive / Actual Class
  • 如果该模型一个y=1的例子都预测不出来,那我们说该模型的精确度为零,虽然此时精确度为 0 / 0 无定义
  • 零召回率和零精确度都能表示该模型不是一个很好的模型,所以我们要求召回率和精确度都很高
  • Precision很高:说话靠谱,Recall很高:遗漏很少
    在这里插入图片描述
  • 我们可以通过取不同的阈值,来选择不同的精确度和召回率。
  • 通常对大多数学习算法来说,当阈值越高,精确度越高,召回率越低;当阈值越低,精确度越低,召回率越高。
  1. F1分数
    在这里插入图片描述
  • 如果通过精确度和召回率不容易判断模型的好坏,我们可以合并精确度和召回率,即取它俩的调和平均数(F1),通过F1的值来判断模型的好坏
  • 调和平均数是强调较小值的平均数
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

丿罗小黑

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值