实习了九个月以后,最大的感触就是一味地埋头做事很简单,但只有不停地复盘与思考,才能取得快速的成长。为了复盘之前做过的数据科学、机器学习项目,列了一个问题大纲来引导自己的思考,可以作为参考:
Objective
目标是什么?需要解决的是什么问题?该问题处于业务的哪一步?
Strategy
用了什么方法完成目标?这里可以进一步拆解成几步:
- 用了什么数据?进行了哪些预处理步骤?
- 用了哪个算法?调了哪些Hyperparameters?
- 用了哪些features?如何确定的这些features?
- 模型是如何进行的优化?
- 模型最终的产出结果是什么?
Measurement
- 用什么metrics来衡量模型的表现?这些metric的局限性是什么?
- 如何validate项目的结果?这些测试方法的优劣势有哪些?
Challenge
开发项目的过程中遇到了哪些重点问题和困难?如何解决的?下次是否能够做得更好?
Alternatives
是否有别的方法同样可以完成目标?为什么选择了目前这个方法?它们的优势和劣势分别是什么?