数据科学应用的领域_我如何进入数据科学领域

数据科学应用的领域

Yelp和Uber的软件工程师进入数据科学的旅程

我不会讨论成为数据科学家所需的特定资格和技能; 关于该主题的资源 很多 ,这取决于您感兴趣的工作类型。相反,我将谈论我进入数据科学(DS)的过程以及帮助我​​进入该领域的一般思维习惯 。 最后,我将介绍一些要点,希望无论您有什么背景, 可以帮助您闯入DS。

我从未打算过渡到DS; 我既没有传统背景,也没有教育背景。 幸运的是,我的工程背景知识教会了我如何编程和批判性思考,但更重要的是如何学习和坚持不懈。 通过阅读论文和从事辅助项目,我几乎可以自己学习所有内容。 没有导师及其诚实和建设性的反馈,我也无法做到这一点。

在学习了两年的软件工程(SE)之后,我加入了Yelp,担任SE实习生,从事与DS相关的项目。 大约一年后,我加入Uber,担任DS实习生,此后不久就毕业了。 这是我关于如何过渡到DS,为什么决定改回SE以及我在这六年中学到的东西的故事。

起点

2012年,我开始在滑铁卢大学攻读机电工程专业。 我一直着迷于您如何通过建立直接帮助人们的生活来积极影响人们的生活。 我最初以为只能通过构建物理事物(例如机器人)来完成,但最终我意识到可以通过软件实现类似的目标。 这就是为什么我在2014年从机电工程专业转到SE的原因。

启动SE后不久,我开始听说机器学习(ML)。 我对ML的兴趣将驱使我在业余时间开始学习它,尽管只是从表面上讲。 同时,我继续学习如何成为一名更好的软件工程师,主要是通过实习。

涉足机器学习

我进入ML的旅程开始平稳。 我没有完成臭名昭著的吴恩达的机器学习课程。 未能完成本科计算机视觉研究项目。 至少我通过了《统计学概论》课程,这是我在大学里唯一修过的统计学课程。 由于统计数据是ML和DS的基本组成部分,因此至少有一件事情是对的。

在我过渡到DS时,这是非生产时间。 我更专注于在美国确保SE实习。 2015年冬天,我终于在加利福尼亚山景城的一家初创公司找到了实习机会。 我使用k-NN和分析仪表板构建了一个简单的推荐系统。 在这些项目上的工作向我展示了如何使用数据和分析来得出有助于制造优质产品的见解。 这引起了我的兴趣,以至于我最终对DS和ML变得更加认真。

深入数据科学和机器学习

2015年秋天,我在Yelp进行了SE实习。 我加入了交通质量小组,该小组的主要目标是识别和防止欺诈和滥用。 我很幸运能够从事与DS相关的项目,即使我被聘为SE实习生。

实习期间我有点挣扎,但是在那里我学到了很多东西。 我了解了有监督无监督的 ML,统计模型的建立 ,如何进行严格的探索性分析以及用于管理大量数据的基础结构。 我了解到了解您的数据和分析方法至关重要,否则可能无法按预期进行。 作为工程师,通常将方法和数据视为黑匣子和抽象就足够了,但这在DS中并不总是有效。 例如,某些方法及其参数仅适用于特定类型的数据,并且需要进行某些假设。

当时,我开始阅读ML论文,因此我可以在实习期间更有效地使用这些工具,例如随机森林k均值逻辑回归 。 我真的不认为这是真正的DS实习,因为我缺乏基础知识,没有与许多同事合作,并且在实习期间需要很多指导。

我在Yelp的经验使我有信心应对更具挑战性的项目。 在我们的Yelp黑客马拉松上,我和我的团队建立了一个逻辑回归分类器来识别SLAPP业务。 这告诉我,检索和批量处理数据与过程或算法一样重要,即使不是更重要。 在另一场黑客马拉松上,我和我的团队为Messenger开发了一个聊天机器人 (在Messenger的虚拟助手成为现实之前); 它能够回答查询和执行命令。 2016年,我与一名博士后合作了几个月,以使用新颖的深度学习方法构建可在移动设备上运行的面部识别系统 。 对于一个学校项目,我们的团队选择在Messenger API的基础上构建一个对话分析工具 ,该工具可以洞察不同的对话,例如情感 ,主题和常用词。

在成功完成这些项目并在2016年夏天在Snap进行另一场SE实习之后,我认为现在是时候该寻求新的东西了。 我认为这可能是ML 而非 DS。

认真考虑数据科学

在2016年秋天,我只考虑SE和ML实习。 参加了Uber DS信息发布会之后,我意识到这可能是一个很好的机会,因为数据科学家从事的有趣项目以及人们的才华看起来如何。 我决定申请。 最终它将成为我曾经申请的唯一DS职位。

由于种种原因,我仍然没有对Uber DS实习进行投资。 我专注于获得SE和ML实习机会; 我没有时间去为DS面试做准备。 我知道这种DS实习非常受欢迎; 只有一个职位,但有数百个申请者(这在我们大学的工作申请委员会上可见)。 我正在与具有正式DS背景的许多称职和热情的同行竞争。 虽然,不用花太多钱的一个好处是,在面试过程中,这让我很省心。 通常我只是想着面试就变得焦虑。

在向Uber申请后不久,我就获得了DS挑战。 它涉及编写SQL,设计实验和进行探索性分析,所有这些都与Uber有关。 这使它变得新颖而有趣。 在进行这项挑战时,我实际上学到了一些东西。 提交我的解决方案后,招聘人员伸出手安排了一个小时的面试,我觉得还可以。 几周后,招聘人员告诉我,我是他们实习的首选-我感到惊讶和欣喜若狂!

我意识到我的经验终于得到了回报–来自Yelp的各种SE实习,ML辅助项目和DS工作。 我会说这些经历足以弥补我缺乏传统DS背景的不足; 他们什么让我的DS背景独特。

进入数据科学

在这一点上,我必须在SE或DS实习之间做出决定。 我看到了DS的方式来增长自己的技能的方式, 区分我从其他软件工程师,喜欢学习更多的分析,最新的研究成果,ML和统计。 我将DS看作是学习比我原先计划更广泛的领域的机会。 过去几年我学到的一切,让我突然意识到,我很容易在Uber取得成功。 基于这些原因,我决定接受2017年冬季的Uber DS实习机会。

这是一次很棒的实习。 我从业内的一些精英中学到了东西,并有机会研究有趣和具有挑战性的问题。 它与我的Yelp经历相似,但更多地强调独立性,演示,交流结果和协作。 在Uber,我对自己的DS能力更加自信。 这种信心帮助我实习后从事了更雄心勃勃的DS项目,例如我们的SE课程简介 。 在这一点上,我正在认真考虑全职使用DS。

在数据科学和软件工程之间做出决定

在2017年秋天,我最后一次实习是在WhatsApp的SE实习。 在2018年,我即将毕业,我必须回答的第一个问题是: 我应该进入DS还是SE?

最后,我决定在WhatsApp中选择SE。 SE满足了我打造影响人们的事物的愿望。 在我在WhatsApp实习期间,这种感觉被重新点燃,因为能够发货的产品立即影响了数十亿用户。 作为最终的用户,我没有像数据科学家那样的感觉。 但是您确实会通过分析和见解对产品产生重大影响。 我观察到工程师与数据科学家的比例通常是几比一。 SE仍然是需求很大的领域-拥有更多职位,我认为这将提供更多的职业稳定性。

由于我的背景和经验,与DS相比,我觉得自己在SE方面的地位更强。 DS有许多适合的背景,这使其以自己的方式具有竞争力。 我看到从事最有趣问题的最佳数据科学家通常拥有物理学,经济学或运筹学博士学位。 如果我想实现他们所取得的成就,那我就必须非常努力。 我不确定我是否对DS有足够的热情去做。 我不认为这是放弃DS,而是利用 SE和我的优势。

外卖

自从我决定进入SE已有两年了:我可以自信地说这是正确的决定。 更重要的是,我对投资DS的时间并不后悔,这仍然是一次很棒的经历,我会一再心动。 如果我可以总结一下自己的旅行经历,那就是我要说的。

学习如何学习

您应该调整您的学习方式 ,使其最适合您要完成的工作。 我发现学习DS和ML的最好方法是阅读研究论文并从事真实的项目 -行动胜于雄辩。 建立学习前后的一致性,就像每天学习一样。 为您要学习和完成的工作设定具体目标,例如每周阅读一篇论文。

寻找导师并接受反馈

要求他们提供诚实和建设性的反馈,尤其是在您想擅长的领域。如果您没有导师,则可以通过工作或相互联系找到一个人。 通常,最好通过连接进行介绍,而不要发送冷门邮件。 确保您是前瞻性的,设定明确的期望,并与您当前和/或潜在的导师达成协议。

稳定下来冒险就更容易了

稳定可能意味着在事业,财务,情感和/或身体上保持稳定。 我对工程和生活感到很舒服。 这给了我在DS和ML中进行探索,实验和失败的空间。 稳定性可以减轻您的压力和压力,让您在初次尝试时就匆匆成功。 确保您感到高兴和坚定,如果有安全网,它将使尝试新事物变得更加容易。

拥抱偶然

我尝试了很多事情,没有太多指导。 有了Uber DS机会后,我意识到我已经做好了把握机会的准备。 保持选择的开放性并耐心等待,即将来临的事情可能就对了。

假货直到成功

每个人都必须从某个地方开始。 之所以具有挑战性,是因为大多数时候甚至在您被录用之前,您都应该知道如何做这项工作。 可以通过教给自己足够的知识来胜任该工作,然后学习该工作中的其他所有内容来克服这一问题,就像我在Yelp和Uber所做的一样。 在职学习通常质量更高,因为您可以解决实际问题,可以使用公司资源,并且可以与同事协作并向同事学习。 经过足够的时间和毅力,您最终将成为真正的交易,不再需要伪造

我希望我的旅程显示出,通过一点点的努力和碰巧,您可以准备好利用这些意外的机会。 祝您一切顺利,祝一切顺利!

我很想听听您的偶然旅程,您对本文的看法或是否觉得有用。 让我知道您在以下评论中的想法。

翻译自: https://hackernoon.com/how-i-broke-into-data-science-p21g3vi6

数据科学应用的领域

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值