转行做数据分析的心路历程

现在很多人不是在学习数据分析的路上,就是在考虑要不要学数据分析的路上,无论是他或她之前所学的专业是理工学科还是文史学科,也无论他或她现在做的工作是不是数据类工作。
如此多的人学习数据分析,再次说明数据分析这个职业非常火爆。至于为什么火爆,无需多言。我们关心的是做数据分析需要什么知识和技能,怎样做数据分析,如何才能成为一个优秀的数据分析师。
转行做数据分析有两年时间了,虽然还不能算作是优秀的数据分析师,但经常有朋友问我:
“是如何转行做数据分析的?”
“做数据分析需要学习什么知识和技能?”
“做数据分析涉及很多数据,没有合适的数据,如何练手?”
上述问题是我被问到的次数最多的三个问题,也是转行做数据分析的两年中感触最深的三个方面,因此就从这三个方面谈一谈这两年做数据分析的心路历程。

一、 我是如何转行做数据分析的?
本科时,在二线城市二流的学校读数学与应用数学专业,因为是财经类院校的应用数学方向,学了一些统计学、数理经济学课程和并应用了很多软件,像Matlab、Maple、C语言、R语言、SPSS、Eviews、Lingo、Lindo等,虽然看似学习了很多技能,但都不精通。因为在学校的时候没有好好学习,当时觉得学这些没有什么作用。后来“书到用时方恨少”,才意识到当时的短见,但后悔已晚。
2012年本科毕业的时候尝试找工作,当时面试的数据分析岗位多数只用Excel就能解决。最后选择了去读研究生,无奈在研究生阶段又几乎“浪费”了三年时间(说“浪费”是相对而言,因为这三年的精力不在数据分析上),当时也没有决定研究生毕业后要做数据分析,当时想去做教育。
研究生毕业后在国企做了和数据分析不相关的工作,无奈工作氛围不是自己想要的,不能最大程度发挥自己的潜能,也不能实现自身能力的增值。在一年半后下定决心转行做数据分析,于是在2017年初开始自学MySQL、Python,并复习统计学知识和R语言。
2017年6月底,辞职,开始了在北京的数据分析工作之旅。由于本科是数学专业,有一定的数学和统计学功底,Excel 在学校和之前的工作中应用的比较熟练,MySQL、R、Python当然还都是初级水平,但还是找到了一份行业数据分析的工作。当时,既庆幸自己在本科的时候学到了一点皮毛,又后悔没有学精。
在转行数据分析后,换工作就有点频繁了,两年换了三份工作。当然每一次跳槽都是为了突破自己,因为每一份工作都有自身的局限性,接触的内容和用到的知识技能有限。但庆幸的是,每一份数据分析的工作都给我提供了一定的潜在发挥空间,借助在工作中可能的发挥空间,不断学习和应用新的知识,当能力提高到一定程度以后,寻找新的机会(这只是从自身发展的角度考虑,当然要感谢每一个东家给予的机会,尽自己所能把工作做到最好,问心无愧)。
如果说在这两年中感悟最深的是什么,那应该是在工作中不断学习,不断提高。

二、 做数据分析需要学习什么知识和技能?
不同工作岗位对数据分析师的技能和经验要求不一样,但数据分析的思维和严谨性是可以在这些工作岗位上训练的。这时,不妨结合自己的兴趣和能力,看自己的能力可以胜任或者说适当提高一下可以胜任哪一种数据分析的岗位。
然后,在招聘网站上看相似岗位的JD,或者向朋友询问一下,这类工作岗位需要哪些能力,查缺补漏,补足自己的短板。当然这一步是需要付出最多的,但只要这一步成功了,数据分析的offer离你就近了一大步。
上面是常识,下面还是具体列一下数据分析需要的知识技能吧:
(1)Excel
Excel是最简单、最基础的数据分析软件,必须掌握,当然VB部分可以不涉及,其他都必须精通。虽然Excel能处理的数据量和能读取的外部数据有限,但在用其他软件将数据处理成汇总或结果数据后,用Excel展示还是很方便的,毕竟Excel 有很多强大的函数和作图功能。
(2)SQL
MySQL、HiveSQL,二者掌握其一即可,因为基本通用,但必须精通,大师和小白的差距会体现在工作效率和质量上。
SQL语言,对数据分析师来说,查询部分最重要。在学会了各种查询后,查询的优化就是必须的了,因为现在的数据量真的很大很大,低质量的SQL语句可能一天都查询不出来,但高质量的查询语句可以在几分钟内搞定。
掌握以上两项,初级数据分析的offer你应该可以得到了。其实基本的数据分析岗位,并没有涉及很多高深的数学或统计学知识,但需要很高的数据敏感度和足够的认真、细心。
(3)Python
Python的功能很强大,也是现在最流行的编程语言,具体就看你学到什么程度了,但基础知识无论如何是必须要掌握的。各种数据类型、数据结构、数据的输入和输出、画图(对大数据展示非常有帮助)这些知识和技能不必多说,请自觉练习吧。
Python能帮助你实现很多目标,爬虫、网站建设、游戏设计,这些就看你的兴趣了,不是必须要求。
(4)R语言
R语言和Python有一定的共通性,很多问题的解决,两者都可以实现,但对统计问题来讲,R语言更受欢迎一些,毕竟这是一个针对统计学问题开发出来的软件,很多数学或统计学出身的朋友可能更喜欢用R语言。
这里列入了R语言,没有列入SPSS,因为R语言软件开源性,小巧易用,能比SPSS处理更大的数据量,且实现更灵活的分析,优势自然胜过SPSS。总之,在你因为懒或者忙没有学会R语言前,你可能会用SPSS;但当你学会R语言后,你应该就再也不会想用SPSS了。
以上是数据分析常用到的四个软件,当然如果你想再深入一步,做数据挖掘,那会涉及很多计算机知识,这里不再阐述。

三、 没有合适的数据,如何练手?
做数据分析,需要多种数据源和大量的数据来演练,如果没有合适的数据,学习数据分析也是无米之炊。有时即使有合适的数据,但需要自己手动输入,浪费时间又不值得。更棘手的情况是,没有合适的数据源和数据样本,怎么办?
相信学习数据分析的同学,都遇到过上述问题,当然我也遇到过。解决的办法是什么呢?数据量小,有可以借鉴的数据,那就自己输入吧,没有人能帮你了。没有合适的数据源,恐怕只有天才,不,只有神能才自己创造出来了(当然伪随机数除外)。
但庆幸的是,公号“数学算法的世界”考虑到朋友们在学习数据分析没有合适的数据源练手的问题后,在每一篇文章中,都会附上数据源下载链接,如果你有需要,就自取吧

在转行做数据分析的过程中,切身体会到了转行的不易(当然包含潜在的经济损失),所以就把自己做数据分析的历程、学习笔记、实战演练相关的内容用“数据科技社”公众号的形式记录下来,以和志同道合的朋友们分享和交流,共同成长和进步。

暂时就写这么多吧,如果有新的感悟和经验,或者朋友们有其他疑问,欢迎回复交流

在这里插入图片描述

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值