为什么需要机器学习策略
机器学习是很多重要应用的基础,例如网页搜索,反垃圾邮件,语音识别等。如果你或你的团队正在开发一个有关机器学习的应用,并且你想要获得快速地进步。这本书将会帮助到你。
示例:建立一个识别含有猫的图片的创业公司
也就是说你建立了一个创业公司,为猫爱好者提供无尽的猫的图片。你打算使用一个神经网络建立一个计算机视觉系统来检测图片中的猫。
但悲催的是,你的学习算法的准确率目前并不够好。所以你面临巨大的压力来改善你的算法。你该做些什么呢?
你的团队有很多idea,比如:
- 获取更多数据:收集更多关于猫的图片
- 收集更多样化的训练集。例如:猫在不同位置的图片;不同着色的猫;不同相机(设置)拍摄的图片
- 通过运行更多的梯度下降迭代次数,来增长训练算法的时间
- 尝试更大的网络,具有更多的层,更多的隐藏单元及参数
- 尝试更小的网络
- 尝试添加正则化(例如L2正则化)
- 改变神经网络的架构(激活函数,隐藏单元的数量等)
- ……
在这些可能的方案中,如果你选择的好,那么你将建立一个领先的关于猫的图片的平台,并带领你的公司走向成功;如果你的选择很糟糕,那么你可能白白浪费几个月的时间。你会选择怎么进行?
这本书将会告诉你怎么去做。大部分机器学习问题都会留下一些线索,这些线索会告诉你什么是有用的尝试,什么是没用的。学会阅读理解这些线索能够节省你数月或上年的开发时间。