吴恩达新书《机器学习年鉴》中文版单页版本
吴恩达新书《机器学习年鉴》全书目录导航
机器学习:让机器学会打游戏系列教程(含视频)
假如你正在做一款语音识别产品,现在你收集了很多语音数据。假如你的语音数据中有很多噪音,因此即使是人类也会有10%的识别错误率。假如你的系统识别错误率已经降到了8%,那你还能用第33章所说的三项技术来改进你的系统吗?
如果你可以定义一个数据子集,在这个子集上人类的水平显著高于你的系统,那么你仍然可以用之前所说的技术来推动你的系统快速发展。比如,假设你的系统在含噪音的音频中,识别准确率高于人类,但人类在非常快速的口语识别中,依然更为优秀。
对于口语非常快的数据子集:
- 你可以找人帮你对快速口语音频进行标记,从而获取高精度的样本数据。
- 你可以通过人类的直觉来理解为什么人类可以正确的识别快速口语,但是你的算法去不行
- 你可以将人类在快速口语上的水平,作为你算法预期的目标。
更一般的来说,即使你的算法的平均性能已经超过了人类的水平,只要能找到人类能做对,但是机器做不对的样本集,那么之前所说的技术都可以使用。。
许多重要的机器学习应用已经超过了人类水平,比如预测电影收视率、火车的送货时长、是否要批准贷款。还有一种情况是人类分类很难,机器也不能处理的很好。因此当机器已经超过人类水平的时候,算法的进展就会变慢了,当机器还在追赶人类时,算法的进展就会快的多。
更多好玩的机器学习教程: 进入袋马学院领一份 ,全部免费?.