独家 | 在Uber,Meta和初创公司的十年教会我的数据分析

ff5804e9fa7d2259f2a79ce74dd6fda8.png

作者:Torsten Walbaum翻译:陈超校对:付雯欣‍‍
本文约4100字,建议阅读10+分钟
本文介绍了作者在初创企业、成长型企业和大型技术企业从事数据分析工作过程中学到的10条经验。

e467366cfbc270724f23545c6bd5601c.png

图片来自作者(Midjourney生成)

在过去十年里,我曾在很多公司从事分析工作,从德国的小型金融科技初创公司到未进行IPO的成长型企业(Rippling)以及大型技术企业(Uber,Meta)。

每家企业都有独特的数据文化和角色定位,也都有其自己的挑战和来之不易的经验教训。下面,你将会看到我在过去十年里学到的最关键的经验,且证实它们大都在不同企业阶段、不同产品或者商业模式下都有效。

1. 你需要用数据讲故事

思考一下你的观众是谁。

如果你在以研究为中心的企业或者主要是面向技术利益相关者(比如工程)展示,一个学术“白皮书”式的分析报告可能是比较适合的。

但是如果你的观众是非技术型的企业团队或者高管,你要确保你专注于关键的观点见解而非技术细节,并且将你的工作与其可能影响到的企业决策结合起来。如果你关注太多分析的技术细节,你会失去你的观众;工作场合的沟通并不是你发现什么值得分享,而是观众需要听到什么。

这种观点主导、自上而下的沟通类型最好用的方法就是麦肯锡顾问芭芭拉 ·明托提出的金字塔原则。看看这篇最近的TDS(Towards Data Science)文章:https://towardsdatascience.com/how-to-better-communicate-as-a-data-scientist-6fc5428d3143,了解作为DS(Data Scientist)如何利用它更好地进行沟通。

2. 强大的商业头脑是好的数据科学家和伟大的数据科学家之间最大的区别

如果你是一家高标准企业的资深数据科学家,你可以期望你所有的同事都有很强的技术能力。

你不会因为逐步提高你的技术技能来突出重围,但是可以通过确保你的工作对利益相关者产生影响最大化而脱颖而出。

这就是商业头脑的用武之地:为了最大化你的影响,你需要:1)深度理解企业优先级和利益相关者们正在面对的问题;2)评估能直接帮助这些优先级或者解决问题的分析方法;以及3)以你的观众能理解的方式与其沟通你的见解和推荐(见第一条)。

有了强大的商业头脑,你将能够明智地检查工作,因为你有了商业背景和判断来理解你的分析、构想的结果是否有用。

商业头脑不是学校或DS训练营教的东西;那么如何培养它呢?以下是你可以做的一些具体的事情:

  • 当公司全体和其他跨团队会议讨论战略优先级时,关注一下

  • 练习将这些优先事项与你的团队工作联系起来;在计划周期或新项目出现时,问问自己:“这与高级业务优先级有什么关系?”如果你不能把这两者联系起来,和你的领导讨论一下

  • 当你在做分析的时候,总是问自己“那又怎样?”只有当你能够回答这个问题并清楚地说明为什么人们应该关心它时,数据点或见解才会变得有关系和影响力。根据这些数据,他们应该采取哪些不同的做法?

最终的目标是从接受请求并处理进来的JIRA工单(校对者注:JIRA是一种由澳大利亚软件公司Atlassian开发的项目管理和问题追踪工具,它最初是为软件开发团队设计的,但现在被广泛用于管理各种类型的项目和工作流程。这里是指专注使用各类数据分析工具的数据分析师,与文章所倡导的关注全局利益者形成对比)转变为成为你的利益相关者的思想伙伴,与他们合作制定分析路线图。

3. 成为一个客观的真相寻找者

许多人挑选数据来符合他们的叙述。这说得通:大多数企业会奖励满足他们目标的人,而不是最客观的人。

作为数据科学家,你有足够的权力来反击这一点。数据科学团队通常不会有直接的业务目标,因此比起销售团队来说满足短期目标的压力会更小。

利益相关者有时会向你施压,要求你找到支持他们已经形成的故事的数据。虽然这样做可能会在短期内给你加分,但从长远来看,对你有帮助的是成为一个寻求真相的人,并推动数据真正支持的故事。

704ee3c6c94f668cf48bfa87dc3c0f3f.png

图片来自作者(由Midjourney创造)

即使这在当时会让你感到不舒服(因为你可能正在推动一种人们不想听的故事),但它会帮助你脱颖而出,当高管们在需要一个未经过滤、不带偏见的关于真实情况的观点时,他们会找你完成。

4. 数据+初步研究=❤️

数据人经常对“轶事证据”皱眉,但这是对严格的定量分析的必要补充。

做实验和处理分析大型数据集可以为您提供统计上重要的见解,但您经常会错过一些信号,这些信号要么没有达到足够大的规模,尚未显示在您的数据中,要么没有被结构化数据很好地提取出来。

深入研究失败的交易记录、与客户交谈、阅读支持单等,有时是发现某些问题(或真正了解根本原因)的唯一方法。

例如,假设您在B2B SaaS(Software as a Service)企业中工作。你可能会在数据中看到企业交易的胜率正在下降,也许你甚至可以将其缩小到特定类型的客户。

但要真正了解情况,你必须与销售代表交谈,深入研究他们的交易记录,与潜在客户交谈等等。一开始,这似乎是随机的轶事和噪音,但一段时间后,一个模式将开始出现;很有可能,这种模式并没有出现在你所追踪的任何标准化指标中。

5. 如果数据看起来太好以至于不真实,它通常就是假的

当人们看到某项指标急剧上升时,他们往往会感到兴奋,并将此归因于他们所做的事情,例如最近的功能发布。

不幸的是,当一个指标的变化看起来似乎是积极的,这往往是因为数据问题或一次性的影响。例如:

  • 最近一段时间的数据是不完整的,一旦所有数据点都加入,度量标准将趋于平稳

  • 一个一次性的顺风不会持续下去(例如,你在1月初看到销量的增长;而不是销售业绩的持续改善,只是假日期间的积压正在释放。)

不要被参数上升的兴奋情绪冲昏头脑。你需要一份健康的怀疑、好奇心和经验,以避免跌入陷阱,并产生具有稳健性的见解。

6. 对变化持开放态度

如果你与数据打交道,定期改变你的观点是很自然的。例如:

  • 你向一位高管推荐了一套行动方案,但由于你获得了更多的数据,你已经对“这是正确的前进道路”失去了信心。

  • 你用一种特定的方式解释了一个指标变化,但是你进行了额外的分析,现在你认为还有别的事情在发生。

然而,大多数善于分析的人都不愿收回他们过去所做的陈述,因为他们害怕显得无能或激怒利益相关者。

这是可以理解的:改变你的建议通常意味着利益相关者需要做额外的工作来适应新的现实,而且他们可能会因此感到恼火。

不过,你不应该仅仅因为害怕丢脸而坚持之前的建议。一旦你对一个观点失去信心,你就无法很好地为它辩护。像杰夫·贝佐斯这样的领导者认识到,当你面对新的信息时,或者只是当你从不同的角度看待一个问题时,改变你的想法很重要。只要你能清楚地说明为什么你的建议改变了,这是一种力量和智慧严谨的标志,而不是弱点。

经常改变你的想法是非常重要的。你不应该让任何人用你过去说过的话来欺骗你。

——杰夫·贝佐斯

7. 你需要务实一点

在分析领域工作的时候,很容易就变得完美主义。你进行了科学方法的训练,对使用最理想的方法来进行分析或实验引以为傲。

不幸的是,经营企业的现实通常会为我们设置严重的限制。我们需要答案的速度要比实验提供统计显著结果的速度要快得多,我们没有足够的用户来提供无偏的分组,我们的数据集也不能做到足够回溯来建立我们想看的时间序列模式。

你的工作就是帮助团队运营企业(运输产品,关闭交易等等)完成所有任务。如果你坚持完美的方法,有可能企业会无视你以及你的观点。

和很多事情一样,完成要好于完美。

8. 不要用临时要求来折磨你的数据科学家

雇佣全栈数据科学家每天主要来构建仪表盘或者做临时的数据提取&调研是一种绝对会让他们精疲力竭的方式,也会让团队人才流失。

许多公司,尤其是高速成长的初创企业,对于专门雇用数据分析师或商业智能(BI)人员来进行指标调查和构建仪表板持谨慎态度。由于人力资源有限,经理们希望团队具有灵活性,能够处理各种任务,因此他们更倾向于雇用全能型的数据科学家,并计划偶尔给他们分配一些仪表板构建或指标调查的任务。

实际上,这种工作量会像气球一样不成比例地膨胀,数据科学家要在这些任务上花大量时间。他们会被这些干扰他们工作重点的低效任务淹没,并且“快问”(从不像他们最初看起来那么快)加起来就占满了一整天,会导致很难在更大的战略项目上同时取得进展。

幸运的是,也有解决方案:

1)使用可以处理简单数据问题的AI聊天机器人;

2)训练相关团队基础SQL的内容(每个团队至少1-2个分析师)使其更加具备独立性。使用Snowflake SQL AI助手或BigQuery中的Gemini辅助,提取数据并产生见解不再严格要求丰富的SQL语法知识;

3)使用给用户以获取所需见解的自主性和灵活性的自助式BI工具。近年来这方面有了很大的进展,像Omni一样的工具让我们更接近自助式分析成为现实的世界。

9. 并不是所有的东西都需要一个华丽的Tableau仪表盘

公司倾向于把从表格中提取数据并转变为BI解决方案视为一种成熟、强大的数据文化的标志。

虽然像Tableau这样的受治理的BI工具适合用于被许多利益相关者频繁使用,并且作为做出关键、难以逆转的决策基础的仪表板,但在许多情况下,Google Sheets可以更快地满足您的需求,无需在几天或几周内规划和构建一个健全的仪表板。

事实是,团队总是会利用他们日常使用的软件(例如Salesforce)和电子表格的分析功能,因为他们需要快速行动。鼓励这种灵活的、分散的分析,而不是强迫所有的东西都通过BI工具的瓶颈,这样你就可以保存数据科学团队的资源(参见上面的第8条),并为团队提供成功所需的东西(基本的SQL培训、数据建模和可视化最佳实践等)。

10. 在整个公司拥有完美的标准化指标是白日做梦

在上面第9条讨论的,整个公司的团队总是会通过在BI工具之外进行令人难受的分析来扫清自己的障碍,但这会让执行共享数据模型变得更难。尤其是在快速成长的初创公司中,如果你希望确保团队仍然能够快速行动并完成工作,那么执行完美的治理是不可能的。

当指标定义不匹配时,这给了很多数据科学家更多的噩梦,也并不是世界末日。大多数情况下,数据之前的差异非常小,他们不会改变整体叙述或最终的建议。

只要关键报告(任何投入生产的东西,华尔街等)以严格的方式处理,并坚持标准化的定义,那么整个公司的数据稍微混乱一点是可以接受的(即使这让人感到不舒服)。

最终想法

上面的一些点可能一开始会感觉不舒服(例如,推翻精心挑选的叙事,采用实际的方法而非追求完美等)。但是从长期来看,你将会发现,它会帮助你脱颖而出,并且将你塑造成真正的思维伙伴。

想要获得更多实际操作的分析建议,请考虑在Medium、LinkedIn或Substack上关注我。

原文标题:What 10 Years at Uber, Meta and Startups Taught Me About Data Analytics

原文链接:https://towardsdatascience.com/what-10-years-at-uber-meta-and-startups-taught-me-about-data-analytics-fd948b912556

编辑:黄继彦

译者简介

95fa7e5aa750dfe91aa3ab54f3547890.jpeg

陈超,北京大学应用心理硕士,数据分析爱好者。本科曾混迹于计算机专业,后又在心理学的道路上不懈求索。在学习过程中越来越发现数据分析的应用范围之广,希望通过所学输出一些有意义的工作,很开心加入数据派大家庭,保持谦逊,保持渴望。

翻译组招募信息

工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。

点击文末“阅读原文”加入数据派团队~

转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。

96ef47d0961003a505e2adb642f06781.png

点击“阅读原文”拥抱组织

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Uber纽约市乘车数据的可视化分析与设计是一项重要的任务,它可以帮助我们更好地理解乘客和司机的行为模式以及整个交通网络的运行情况。以下是针对该主题的300字中文回答: 在Uber纽约市乘车数据的可视化分析与设计方面,首先需要收集和整理大量的数据。这些数据包括乘客和司机的行程起止地点、乘车时间、乘车距离、费用等信息。然后,利用数据分析工具,对这些数据进行统计和分析,以提取有用的信息。 一种常见的可视化分析方式是通过地图展示乘车数据的分布情况。可以利用纽约市的地图底图,将乘车起止地点标记在地图上,采用不同的颜色、形状或大小来表示乘车次数或乘车密度。这样一来,我们可以直观地看到乘车热点和流量分布的情况,从而帮助我们优化乘车服务的分配和调度。 除了地图展示,还可以通过折线图或柱状图展示乘车数据的时间变化趋势。可以按照小时、日期、星期几等时间维度,统计乘车次数或乘车费用的变化情况。这样可以发现乘车高峰和低谷的时段,为乘车服务的优化提供数据支持。 另外,还可以对乘车数据进行空间分析,比如利用热力图展示不同地区的乘车活跃度,或者利用流向图展示不同地区之间的乘车流量。这些空间分析可以帮助我们发现交通拥堵的瓶颈区域,或者调整司机派单策略,提高乘车效率。 总之,Uber纽约市乘车数据的可视化分析与设计是一项复杂而有益的工作。通过合理运用可视化工具和技术,可以帮助我们更好地理解和优化乘车服务,提高城市的出行效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值