读博还是找工作?数据科学家之路该怎么走?


全文共1793字,预计学习时长6分钟

图源:unsplash

很多人对于数据科学领域充满热情,但同时也有着很多困惑不知该如何下手。Python还是R语言?多学还是少学数学?要不要攻读博士?如何获得该领域的第一份工作?

这样的问题,笔者看到过很多。笔者不是职业咨询方面的专家,但基于对该领域的观察和多年来积累的经验,希望能给年轻人们一些建议。

1.学习机器学习的好资源有哪些?

笔者很喜欢安德鲁的“机器学习Coursera”课程。该课程入门时很容易,之后难度递增。它主要教授机器学习的基础知识,这是它的优点。

笔者建议各位至少去听一下前几节课。不能完全听懂也没有关系,以后随时可以重新观看课程。当然啦,不要只关注一门课程,大家的学习情况各不相同,根据自身情况来选择。

图源:unsplash 

2.对于几乎没有任何技术背景的人来说,什么是最好的学习方法?

不要一个人学习!

寻找并加入网络社区将有助于各位的学习和成长。可以用Excel练习机器学习,试试线性回归吧。用它作为首次挑战,将会激发学习者的学习动力。

3.学习和实践数据科学的最佳方法是什么?

笔者建议从实际项目入手,然后在理论上慢慢发展。使用Kaggle笔记本是学习实践部分的好方法。在Reddit communities或Cross Validatedcommunity上面提问。

对所掌握的工具和实践知识感到满意以后,笔者建议自己构造一些问题的数据集(比如,可以自己抓取数据)并将机器学习算法应用于该数据集。

机器学习领域最难的是数据集构造,你甚至可以通过数据集构造建立公司。

 

4.该学Python还是R语言?

这是一个显而易见而又被忽略的问题吧。如果你还没有开始学习,那么笔者建议学习Python。主要原因如下:

·        该语言仍在不断发展。

·        丰富的数据科学生态系统、后端——凡是各位能说出来的,Python都有。

使用者可以利用Python进行分析,从头开始开发模型并在生产中运行。虽然可以肯定R语言的模型也可以在生产中运行,但笔者还尚未听说过。

如果各位了解R语言,也完全没问题。数据科学团队通常两种语言都用,根据喜好选择就OK。这并不重要,因为有些模型必须用编译语言(Java、Go)重新实现,从而在生产中进行更快的预测。

5.应该多上一些数学课吗?

长远来看,数学学得越多就越好。了解数学将有助于各位更好地明白刚刚编写的黑盒背后发生了什么。除此之外,将知识从理论转化为实践也更加容易。

图源:unsplash

6.数学和统计在数据科学工作中重要吗?

数学在改进模型方面发挥着至关重要的作用。数据科学工作者需要借助数学来弄清楚不同类型的模型、分布等事物之间的区别。一些高级机器学习工程师可以从优化函数中看出模型的主要属性。

7.应该学习结构化查询语言吗?

这个问题往往无法解决,但笔者的答案是“YES”!

无论是否要用结构化查询语言数据库,各位都应该从相关的数据库中了解主要概念,比如连接、分组依据、窗口函数、滞后、超前等等。即使是使用pandas、R语言或其他工具,这些概念也是必不可少的。

 

8.为了做好投身数据科学工作的准备,应该参加哪些课程?

任何领域都需要数据科学家,无论是现在还是将来。学习结束后,各位想去哪家公司实习?如果已经听过一些相关课程,那么你获得生物信息学领域的实习机会将更加容易。

9.如何获得数据科学领域的第一份工作?

 

参加本地的招聘会。公司在招聘会上猎寻新员工。还可以去数据质量评估部——规模较大的公司有这样的部门。也可以试试在网络上找工作。

10.从事数据科学工作需要博士学位吗?

不需要博士学位。从事数据科学工作意味着将机器学习模型应用于现实世界数据的分析。如果你的目标是研究和开发新的机器学习算法,那么笔者建议去攻读博士学位。

 

图源:unsplash

11.如何判断哪份工作提供最好的导师?

“如果你获得了多个工作机会,那么要选择导师更好的那个工作。”那么该如何判断哪份工作有最好的导师呢?

尽可能多地获取有关面试过程中的团队成员、经理、这些人背景等方面的信息。查看他们的领英页面,他们是否在Quora、StackOverflow、Medium上发表过自己的见解?发挥你的信息检索能力,做好调查很重要。

 

知道正确的道路要比埋头赶路重要很多,各位在怀着满腔热情投入数据科学行业之前,请先好好看清眼前的道路,以到达期望的远方。

 


推荐阅读专题

留言点赞发个朋友圈

我们一起分享AI学习与发展的干货

编译组:周果、王欣

相关链接:

https://towardsdatascience.com/what-advice-would-i-give-to-aspiring-data-scientists-9b47c6194369

如转载,请后台留言,遵守转载规范

推荐文章阅读

ACL2018论文集50篇解读

EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾

长按识别二维码可添加关注

读芯君爱你

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值