机器学习项目生命周期
1.计划项目
这个阶段我们确定要解决什么样的问题,实现预期目标。
还要考虑AI的道德影响,等一些潜在问题。
2.收集标注数据
在这个阶段,我们确定数据的来源,基于什么样的事实来对数据进行标注。
一些时候,可使用的数据质量并不是很高,我们可能要收集更多的数据,并回到第一步重新分析问题和预期目标。
3.训练调节模型
这个阶段我们快速搭建模型。
应用先进的方法,调节我们的模型。
这个阶段我们可能会看到我们收集的数据并不一定可靠,因此我们可能回到第二部重新整理数据。
此外,还要审视预期目标是不是可实现。
4.模型部署与测试
这个阶段我们将模型从实验室部署到生产环境中,回到阶段三。
我们可能发现生产中模型的表现大概率与实验训练的效果偏差很大,
或者训练的数据与生产中的数据差别很大,我们可能会回到第二阶段。
再或者并没有帮助我们提高效率,带来价值,
我们可能会回到第一阶段重新审查目标。
一点总结:
我们学习到的机器学习都是以调节模型为主,像网站或学校的教学内容,因为这是为了后期的 Research 导向。
但是在生产中的机器学习应用不只是创建和调节模型,开发人员会花更多的时间在收集和处理数据上,因为什么样的数据决定了我们的模型效率和我们能不能达到生成预期目标。
一些时候我们的应用可能不需要机器学习。