想找个数据科学家的工作吗?别再随大流了!

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


者:Jeremie Harris

编译:ronghuaiyang


前戏

人工智能,机器学习,深度学习,大数据是最近最热门的工作,很多人都想转行,问题是,你如何才能在这么多人之中脱颖而出呢?看看下面的内容,说不定能让你少走很多弯路!

640?wx_fmt=png

我依然记得当我的兄弟决定卖掉比特币的那个时刻。那是在2017年,我在星巴克,我们遇到一个中年妇女,在发小册子,封面上用黑体写着:“比特币:早点退休的捷径”。

我很好奇,所以我问她,加密货币市场是怎么样的,但是结果她除了比特币之外一无所知,以太坊?“从来没听过”,莱特币?“是不是便宜版本的比特币?”。

当你发现家附近星巴克的中年妇女都在让你了解最新的科技,你可能正在接近炒作的顶峰,或者说,“泡沫”。

这并不是什么新的发现,人人都知道,当涉及到投资的时候,如果你做的事情,其他人也在做,你是不太可能有回报的。奇怪的是,当投资自己的时候,人们并没有运用同样的推理。

比如说,你要找个数据科学家的工作,如果你在做标准的“我要当一个数据科学家”的事情,这意味着你可能得不到你理想的工作。市场上充满了青年才俊,大多数有抱负的普通数据科学家不太可能获得太大的吸引力。所以,如果你想要避免一个大多数人的结果,为什么做大多数人做的事情?

问题是,人们开始数据科学之旅的时候,大多数人并不是这么想的。我和上百个有抱负的数据科学家聊过,80%的人基本上讲的是同样的故事:

  1. 首先,先学入门 (Python + sklearn + Pandas + 或者一些 SQL 或者其他的)

  2. 然后,学一些千篇一律的网上课程

  3. 看一些职位的描述,发现其中要求的自己一点都不会,开始慌了

  4. 或者看点别的网上课程,或者开始申请一些职位

  5. 没什么反馈(最多有几个面试)

  6. 开始郁闷,想读个硕士,申请更多的职位

  7. 到了决定的时候了:重复2到7,看看是不是会发生点别的?

如果这个在你身上发生过,可能你也在自我提升的泡沫里:你在做其他人做过的同样的事情,但是期待不同的结果。第一件事你要做的就是停下来。

如果你想要高于平均水平的结果,你就不能做平均水平的事情,为了避免做平均水平的事情,你需要知道哪些是平均水平的事情。

这里有几个例子:如果你需要通过网上课程来入门,可以,但不要陷入MOOC的恶性循环中:MOOC基本上是为普通人设计的,所以你不可能通过多做它们而成为出色的候选人。同样的,如果你的GitHub上有4到5本同样无聊的sklearn/ panda /seaborn/Keras的Jupyter notebook,不要再做另一个了

总的来说,规则是:如果某件事看起来是显而易见的下一步,因为其他人都在做这件事,那么“不做”是件好事。相反,你需要找到别人没有做的事情,并尽快去做。

那么别人没做过的那些事情是什么呢?根据我的发现,我想到了5个:

  1. 复现论文。如果你是一个深度学习爱好者,这一点尤其正确。人们之所以不这样做,因为这比获取数据集并使用简单的ANN或XGBoost进行千篇一律的分类要困难。在arXiv上找到与您的领域相关的最有趣的论文(最好是最近的一篇),并阅读它,理解它,然后,复现它,可能在一个新的数据集上,写一篇关于它的博客。

  2. 不要呆在你的舒适区里。如果你开始一个新项目,最好是学习一些新的框架/库/工具。如果您正在构建第6个以df = pd.read_csv(文件名)开头、以f1 = f1_score(y_true, y_pred)结尾的 Jupyter notebook,那么是时候更改策略了。

  3. 学习点无聊的事情。其他人不这样做是因为没有人喜欢无聊的事情。但是,学习正确的Git流、如何使用Docker、如何使用Flask构建应用程序、以及如何在AWS或谷歌云上部署模型,这些都是企业迫切希望申请者具备的技能,但大多数申请者都没有充分认识到这些技能。

  4. 做点令人讨厌的事情。1)在本地的数据科学会议上提交一篇论文。或者,至少参加一下当地的数据科学聚会。2)在LinkedIn上给别人发冷信息。试着提前提供有价值的信息(“我刚注意到你的网站出现了一个错字”)。不要马上向他们要工作。让你的问题尽可能的具体(“我想在我的博客上得到你的反馈”)。你试图建立一种关系,扩大你的关系网,这需要耐心。3)参加会议和社交活动。4)组建学习小组。

  5. 做一些看起来疯狂的事情。每个人都去UCI仓库,或者使用一些库存数据集(哈欠)来构建他们的项目,不要这么干了。了解如何使用web抓取库或一些不受重视的API来构建自己的自定义数据集。数据很难获得,公司通常需要依靠他们的工程师来获取数据。你的目标应该是让别人觉得你是那种痴迷于数据科学的疯子,只要能把工作做好,会自己构建数据集。

这些策略会让你避免成为招聘人员每天要面对的噪音。它们不是什么灵丹妙药,但能让你在数据科学的就业市场上获得更大的吸引力,成为更有能力的数据科学家。

在一天结束的时候,记住当你在培养你的技能时,你是在为自己投资。这意味着同样适用于投资的经济原则也适用于你自己:如果你想要一个杰出的结果,你就必须做杰出的事情。

英文原文链接:https://www.kdnuggets.com/2018/11/get-hired-as-data-scientist.html


640?wx_fmt=png

往期精彩回顾


1、最全的AI速查表|神经网络,机器学习,深度学习,大数据

2、资源|10个机器学习和深度学习的必读免费课程

3、论文看吐了没有?做研究的同学瞧一瞧看一看啦,教你读论文:为什么读以及如何读

4、Python代码实践|随机森林是“黑盒子”?不存在的,撸完代码你就懂了

5、经验之谈|别再在CNN中使用Dropout了


本文可以任意转载,转载时请注明作者及原文地址

640?wx_fmt=jpeg

请长按或扫描二维码关注本公众号


请帮忙点击下方的广告,这么大冷的天,每天晚上写公众号,都累瘦了,各位就当是给我加点营养了,点击一下,然后关掉就行,谢谢大家!

640?wx_fmt=jpeg

换只胖点的,让原来那只休息休息
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值