深度学习第三课结构化机器学习项目第一周机器学习策略（一）笔记和作业

最新推荐文章于 2019-11-19 20:14:52 发布

Vico_Men

最新推荐文章于 2019-11-19 20:14:52 发布

阅读量537

点赞数 1

分类专栏：深度学习文章标签：吴恩达网易云课堂深度学习数据集划分贝叶斯误差

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_28031525/article/details/79001040

版权

深度学习专栏收录该内容

14 篇文章 1 订阅

订阅专栏

ML的策略

Example：搭建一个神经网络结构有很多可选择的ideas如何判断哪些ideas真的能起到效果
这里写图片描述

判断系统性能 <—使用单一数字评价指标（eg：F1 score/average score）
优化指标 <—对于N个指标的，尽量优化单一指标优化，其他的设置阈值
这里写图片描述
大数据时代，测试集可以划分为更小的集合

　　验证集和测试集的分布应该保持一致，因为在验证集上选取模型放在实际的应用上，需要在之间保持相关性，相反训练集和测试集之间存在分布不同并不是多大的问题，在一些情况下，对于数据集的划分，可以参考下图：
这里写图片描述
　　由于网络上获取的数据并不完全符合实际的数据分布，假设从网络上共获取900000图像照片，以及100000实际的图像照片用于训练，可以通过以上方式组合。

ML会在接近或者超过人类水平之后变得越来越慢的原因：
1. 在低于人类水平时，往往有很多工具可以使用，而surpassing 人类之后，依靠人类的直觉很难判断优化的方向；
2. 在某些任务上，人类的水平已经很接近贝叶斯误差（理想值），而ML超过人类之后也许没有太多的可优化的空间。
这里写图片描述

ML超过人类的领域：
这里写图片描述
　　特别是对于这种结构化的数据（structure data），需要大量数据分析的领域，而在另外一些领域，比如语言识别、自然语言方面机器学习还很难超越人类的表现，主要是人类擅长于处理这类自然感知的问题。

　　以人类水平（Human-level）作为基准，在许多任务中，往往将人类水平看做贝叶斯误差的代理（proxy），但是实际上一些任务中可能贝叶斯误差不能达到0%。
这里写图片描述

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习第三课结构化机器学习项目第一周机器学习策略（一）笔记和作业

ML的策略Example：搭建一个神经网络结构有很多可选择的ideas如何判断哪些ideas真的能起到效果判断系统性能优化指标大数据时代，测试集可以划分为更小的集合　　验证集和测试集的分布应该保持一致，因为在验证集上选取模型放在实际的应用上，需要在之间保持相关性，相反训练集和测试集之间存在分布不同并不是多大的问题，在一些情况下，对于数据集的划分，可以参考下图：
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。