第三部分 机器学习(ML)策略1 - 6 笔记

1.11 超过人的表现
Surpassing human-level performance
例子 分类任务
Classification task

Case1:可以认为贝叶斯误差为0.5%,可避免偏差是0.1%,方差是0.3%,应该侧重于调整方差。
Case2:训练误差以及开发误差以及超过了人类水平,很难评价是该调整方差还是偏差,模型的精度肯定还是可以进一步改进的,但是并不清楚最优贝叶斯误差是多少,在算法调整的方向上会变得不清晰,这也就意味着在超过人类水平,算法改进难度增加。
机器学习超过人类水平的领域:
  • 网络广告(Online advertising)
  • 产品推荐(Product recommendations)
  • 快递时间预测(Logistics / predicting transit time)
  • 信贷评价(Loan approvals)
注:上述四个领域,采用的数据多是结构化数据(structural data),而且并非自然感知问题,即非计算机视觉、语音识别、NLP问题。人类在自然感知问题上会很在行。并且在处理上述问题时,可以获取并访问到大量的数据,可能比任何人能够获取的数据还要多。
  • 语音识别(Speech recognition)
  • some 影像识别 (Image recognition)
  • 医学领域(medical)—— ECG 、 Skin cancer、certain narrow radiology task ...

1.12 改善你的模型表现
Improving your model performance
一个监督学习算法达到实用,需要满足两个前提:
  1. 针对训练集,模型拟合的足够好 —— 低可避免偏差
  2. 模型在开发集和测试集上泛化能力较强 —— 方差不能太大
提升机器学习系统的策略:
  1. 低偏差
    1. 训练更大的模型
    2. 增加训练时间
    3. 使用更好的优化算法
    4. 新的网络架构 (RNN、CNN etc.)
    5. 超参搜索
  2. 低方差
    1. 更多的数据
    2. 正则化 —— L2 、dropout 、 data augmentation ...
    3. 新的网络架构
    4. 超参搜索
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值