注:在本文中,虽然我使用数据科学家一词,但是诸如机器学习工程师,数据分析师,数据工程师,BI分析师之类的热门职务也承担着类似的责任,可以在此处互换使用。
本文编译自Dan_Friedman的技术博客。
我对成为数据科学家的潜在影响寄予厚望。我觉得每个公司都应该是一个“数据公司”。
但我的期望没有达到现实。
我的期望从何而来?
我在2016年中参加了为期12周的数据科学训练营。在这12周的时间里,有11周的时间专注于机器学习(ML)和人工智能(AI)。彼时,ML和AI的新闻报道创下了历史新高。特斯拉为自动驾驶汽车铺平了道路,甚至像通用汽车(GM)这样的老庞然大物也向一家AI公司投资了超过10亿美元,以保持其在汽车技术领域的领先地位。在消费者端,出现了可以利用AI技术进行同声传译的耳机,也出现了可以击败世界上最好电竞团队的AI。
那时我觉得如果我努力钻研代码和数据,可以发现一些隐藏的范式,在工业上利用机器学习模型并能对其进行优化。高管可能会依靠我的基于数据的见解来确定产品路线图,此时我将在公司发挥巨大价值,走上人生巅峰。
但是,几乎没有任何事情发生。
在过去的几年中,我曾担任数据科学家,数据工程师和行业顾问。我还从数十位数据科学家和类似行业的故事中学到了东西,积极阅读有关数据科学的文章,并在Twitter上关注数据科学的领袖人物。
在这些实践当中,我发现了一些共性的问题。
以下是数据科学未能达到行业期望的七种共性问题。后面我会针对这些问题提出解决方案。
-
人们不知道“数据科学”的作用。
-
数据科学的领导力非常缺乏。
-
数据科学不一定总是按照规范构建的。
-
你可能是唯一的“数据人”。
-
数据科学家的影响力很难衡量-数据并不总是可以转化为价值。
-
数据和基础架构存在严重的质量问题。
-
数据工作可能非常不道德。需要道德勇气。