复盘数据科学项目的五个问题

实习了九个月以后,最大的感触就是一味地埋头做事很简单,但只有不停地复盘与思考,才能取得快速的成长。为了复盘之前做过的数据科学、机器学习项目,列了一个问题大纲来引导自己的思考,可以作为参考:

Objective

目标是什么?需要解决的是什么问题?该问题处于业务的哪一步?

Strategy

用了什么方法完成目标?这里可以进一步拆解成几步:

  • 用了什么数据?进行了哪些预处理步骤?
  • 用了哪个算法?调了哪些Hyperparameters?
  • 用了哪些features?如何确定的这些features?
  • 模型是如何进行的优化?
  • 模型最终的产出结果是什么?

Measurement

  • 用什么metrics来衡量模型的表现?这些metric的局限性是什么?
  • 如何validate项目的结果?这些测试方法的优劣势有哪些?

Challenge

开发项目的过程中遇到了哪些重点问题和困难?如何解决的?下次是否能够做得更好?

Alternatives

是否有别的方法同样可以完成目标?为什么选择了目前这个方法?它们的优势和劣势分别是什么?

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值