人心散了队伍不好带了?那是你没看这份宝典!

640?wx_fmt=jpeg

全文共2511字,预计学习时长5分钟

管理数据科学项目中各个参与方一直是个棘手的问题。很多高管和专业人士都陷入了对数据科学技术的狂热之中,但并没有真正理解一个成熟项目必须具备的要素。

640?wx_fmt=png

实际上,把“研究雏形”转换为完备的商业化数据驱动产品需要付出大量不容小觑的努力。以下是学习内容中的重点:

· 从数学角度来说,高质量的数据科学解决方案是最终产品成功和提高客户满意度的必要不充分条件。

· AI功能需要与端到端系统的其他部分完全协同,才能成功解决业务问题。

640?wx_fmt=jpeg

Sachin-Tendulkar期望综合征

几乎所有人都认为数据科学/AI/机器学习是万能的,能够即刻并永久地解决困扰公司的任何问题。

如果认为这是夸大其词,粗略搜索各公司的AI服务报价或者超链接中有“ai”的公司数量,结果应该能让读者心服口服。

这一现象称为Sachin-Tendulkar-Expectation期望综合征(STES)。Sachin Tendulkar是世界上最优秀的板球运动员之一。在20世纪90年代末和21世纪初期,人们期待Sachin在每场比赛中打破记录。

640?wx_fmt=png

这种期望实际上让人们不再轻易为他的成绩而惊叹。如果确实打破了记录,那就是“符合预期”,否则就是“大失所望”。

因此,数据科学项目领导者肩负双重责任:

· 提供符合实际的、满足合理业务需求的解决方案

· 处理好各利益相关方的不合理期望

本文将讨论主要利益相关者的身份,分享跟他们合作的一些经验。

640?wx_fmt=jpeg

了解相关参与方

广义上,有三个主要的参与方。每个参与方都有优先级,有时会彼此冲突。作为数据科学交付领导者,首要责任是处理好三方关系,确保每一方认清其他两方的立场,同时保持终端用户的中心地位。只有这样才能得出最佳的实际方案。

640?wx_fmt=png

三个参与方是:

· 面向客户的团队

· 执行团队

· 数据科学团队

前两个团队通常不受交付领导的直接管理,而第三个团队位于领导者的直接管辖范围内,这使管理更加复杂。

640?wx_fmt=jpeg

客户对数据驱动产品的期望是“流动的”

面向客户的团队可以第一时间了解客户对现有产品的看法以及竞品的情况。这些可用于改进现有的数据驱动解决方案,赋予方案新的优势。

说起来容易做起来难。面向客户的团队总是难以在不破不修与紧跟潮流中寻求平衡。在这两种极端情况之间寻找解决方案并非易事。

具体而言,如果数据驱动产品始终维持原样,那么性能将随着时间的推移逐渐下降,难以确定系统何时失效。

更重要的是,如果执意等待完美的解决方案,最终也许可能得到一个完美但迟到的解决方案。或者更糟糕的是花费大量时间处理鸡肋问题。

面向客户的团队必须与数据科学团队和客户合作,商定何时部署解决方案的试运行,确立“持续改进”的目标。即便是谷歌这样强大的搜索引擎,准确度也在逐年提升。通过从用户行为中潜移默化地学习数据驱动技术,它肯定还将更加准确。

640?wx_fmt=jpeg

消除“100%准确率错觉”

面向客户的团队也要注意“100%准确率错觉”。对于数据驱动方案准确性的判定因用户而异。通常,如果满足了基本需求,终端用户也能容忍错误的出现。

例如,假设使用图像搜索引擎搜索“jaguar”,用户对搜索引擎准确性的判断大致受两方面影响:

· 搜索引擎实际输出的内容

· 用户试图搜索的是名为jaguar的动物(美洲豹)还是交通工具(汽车品牌“捷豹”)

也有可能用户搜索的是名为jaquar的卫浴配件制造公司。如果搜索引擎将这些图像与动物/车辆图像一起显示,并给出“您是否拼写错误”的提示,用户可能会眼前一亮。

类似地,即使前几个搜索结果不相关,但如果第五个搜索结果正是他们寻找的内容,大部分用户仍会感到满意。

在推出新方案时,有必要和面向客户的团队以及客户本身进行沟通来管理他们对产品的期望。

640?wx_fmt=png

使用图像搜索引擎搜索”jaguar”得到的不同结果。请注意,图中所有结果都可能是正确的。

第三个方面是团队需要了解数据驱动解决方案本身就具有不确定性。这些解决方案通常会经过一个训练期,其中所有方案利用所有可能数据样本的子集进行训练。

实际操作中,即使与训练样本相似的输出样本也常常产生错误输出。一个好的数据驱动算法应该具有普遍性(即,对未处理过的输入样本给出正确输出),但几乎不能保证100%的准确率。

这与纯软件驱动解决方案的工作方式完全不同。后者的一个例子是,点击网站上的“绿色启动图标”,就一定会打开新页面。面向客户的团队必须了解这一区别。

640?wx_fmt=jpeg

AI方案的成功需要产品战略和执行的范式转变

第二组参与方是执行团队。AI/机器学习基本上吸引了所有主流媒体的想象,尤其是主要迎合技术高管的媒体。

因此,高管们需要切实保证公司正在利用人工智能革命。同时需要了解AI解决方案有着自身独特的开发,部署和维护周期,并因此需要截然不同的时间计划表。

在与执行团队沟通时,区分所谓的“用户AI”和“企业AI”至关重要。

640?wx_fmt=png

图片来源:Fabrik Brands

“AI可以解决任何问题”的印象主要源于低风险的问题。一些典型的低风险“用户-AI”问题例子如下:

· AI驱动的社交媒体好友推荐

· AI驱动的电影选片建议

最坏的结果也就是一部恐怖片可能被当作浪漫喜剧推荐给用户。

这与“企业-AI”形成鲜明对比。例如,用AI驱动的解决方案检测高速公路上的汽车车牌号,以标记罪犯驾驶的汽车。想象一下,如果AI方案错把“5”当成“6”,那么武装巡逻车就会抓捕无辜的驾驶员。

这种错误有可能带来数百万美元的诉讼赔偿。笔者将这些情况称为高风险的“企业AI”场景。

640?wx_fmt=jpeg

在“数据科学炫酷/风格”和“交付质量”之间寻求平衡

第三组参与方是数据科学团队。目前为止,这是及时提供数据驱动解决方案的核心。这个团队通常仅仅专注于使用最新最酷的技术,而不考虑技术应用是否合适。

交付领导者必须定期提醒数据科学团队,AI只是整个问题的一部分,终端用户几乎不会直接接触数据科学部分。此外,终端用户不会因为产品应用了最新最酷的技术而宽容产品出现的错误。

640?wx_fmt=png

交付领导者的另一个重要作用是减轻团队的日常交付压力。这有助于他们深入探索解决手头问题的系统方法。这样的减压对数据科学团队(与软件开发团队相比)进行实验尤为重要。

这是因为数据科学理论与实践之间存在着巨大的差距。此外,培养有助于解决机器学习问题的企业文化也将提高工作满意度。而这又会反过来使员工保持健康状态。

640?wx_fmt=jpeg

留言 点赞 发个朋友圈

我们一起分享AI学习与发展的干货

编译组:张静影、孙梦琪

相关链接:

https://www.analyticsvidhya.com/blog/2019/08/data-science-leader-guide-managing-stakeholders/


如需转载,请后台留言,遵守转载规范

推荐文章阅读

ACL2018论文集50篇解读

EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017 论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾

长按识别二维码可添加关注

读芯君爱你

640?wx_fmt=gif

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值