如果你正在开发全新的机器学习应用,你应该尽快建立你的第一个系统原型 (quick and dirty),然后快速迭代。
下面以语音识别系统为例:
一开始,我们有许多选择,不同的方向向前推进,而且每个方向都是相对合理的,可以改善你的系统。
但是挑战在于,你如何选择一个方向集中精力处理。
吴恩达老师给出的建议是:如果你正在开发全新的机器学习应用,你应该尽快建立你的第一个系统原型(quick and dirty),然后快速迭代。
Build your first system quickly, then iterate.
- 快速设立开发集、测试集和指标,这样就确定了目标所在(target)。如果目标定错了,之后改也是可以的。
- 快速搭好一个机器学习系统原型,然后在训练集上训练。根据开发集测试集和评估指标,来理解你的算法表现如何。
- 偏差方差分析和误差分析,来确定下一步的优先级。
比如在误差分析中发现,大部分误差的来源是人远离麦克风,这就确定的下一步的方向是解决这个问题(远场识别技术)。