在刚入行的时候曾经写过一篇文章「数据专案团队组成」,当时把数据团队根据技能分成数据科学家、数据分析师和数据工程师三种角色。不过在工作几年之后,发现实务上的数据分工其实更细而且更复杂,也隐含了更多的可能性。这一篇文章将谈谈实务上的数据团队分工。
不同的技能与分工
首先我们先依照技能与工作简单分成三种类型:
- 擅长 #分析应用 的: 数据分析师(Data Analyst)
- 擅长 #程式实作 的: 数据工程师(Data Engineer)
- 擅长 #模型理论 的: 数据科学家(Data Scienist)
换句话说,他们分别是「看数据」,「调数据」以及「玩数据」。不过实际上的分工与职能其实会更加复杂一点,有几种常见的状况:
- 数据科学家与数据工程师中间的 GAP
- 模型「部署/上线」的工作谁来做?
- 「数据分析师」与「商业分析师」
数据科学家与数据工程师中间的 GAP
在擅长模型数据科学家与擅长程式数据工程师之间,会有一小段的重叠的范围。通常的合作方式会由数据科学家训练出一个好的模型,再由数