【吴恩达机器学习】第12章 机器学习系统设计

确定执行的优先级

列出可能的解决方案,然后权衡选择。而不是一开始只是关注去收集更多的数据。例如对于垃圾邮件可以有以下一些方案:
在这里插入图片描述

误差分析

一般先花一天时间,简单粗暴的实现一个算法,画出学习曲线,然后逐步改进。

  • Start with a simple algorithm that you can implement quickly.
    implement it and test it on your cross-validation data.
  • Plot learning curves to decide if more data, more feature, etc. are likely to help
  • Error analysis: Manually examine the examples(in cross validation set) that your algorithm made erros.
    See if you spot any systematic trend in what type of examples it is making errors on.

The importance of numerical evaluation
尝试不同的改进方式,并在交叉验证集上评价。

不对称性分类的误差评估

偏斜性问题:在分类问题中,正类与负类样本数量不平衡。

对于偏斜性问题可以用:Precision与Recall来评价模型

Precision(查准率):True positive / # predicted positive
在这里插入图片描述
Recall(召回率):True positive / # actual positive
在这里插入图片描述

精确度和找回率的权衡

提高精确度:将 h θ ≥ 0.5 h_\theta \ge0.5 hθ0.5调整为 h θ ≥ 0.7 h_\theta \ge0.7 hθ0.7
在这里插入图片描述
查准率与召回率
在这里插入图片描述
综合
在这里插入图片描述

机器学习数据

不要盲目搜集大量数据。但哪些条件下,大量数据有助于生成更好的模型。

  • 特征数量足够
  • 参数很多
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值