吴恩达机器学习课程09——机器学习系统设计

本文探讨了机器学习系统设计中的误差分析,强调了在处理偏斜类(如疾病诊断)时,精确度和召回率的重要性。通过实例解释了如何通过调整分类阈值来平衡两者。此外,还提到了大量训练数据对于算法性能提升的关键作用,以及特征选择在机器学习中的重要性。
摘要由CSDN通过智能技术生成


误差分析

  • 一些建议:
    在这里插入图片描述
    吴恩达老师提供了很多机器学习的建议方法,比如上面提到的三条:
    1.当你接手一件任务的时候,先用最快速的方法完成目标,去实现它。
    2.然后就是修修补补了,比如绘制学习曲线,进而决定是否需要更多的数据、更多的特征等等。
    3.误差分析操作,这个挺有意思的,就是针对那些你预测的不是很准确的数据,人工分析一下, 看看它们都具有什么特点,从而决定是否增加一些针对性特征等等。
    比如说:
    在这里插入图片描述
    以区分垃圾邮件为例,假如500个样本中,有100个我们区分错了,那么我们对于这100个出错的样本进行分析,分别从邮件类型和邮件特点来分析:
    1.结果发现,53个垃圾邮件都是关于盗
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CtrlZ1

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值