从零到字节跳动数据分析师,我究竟经历了什么?

242 篇文章 0 订阅
231 篇文章 10 订阅

都说转型之路难,这句话说的果不其然,从一个零基础的小白,到现在我能在字节跳动担任数据分析师,这个过程,我走了1年多时间。

没有背景,没有高学历,没有相关的学历,是我入行前最大的痛点。我是工科土木工程专业的学生,大专学历。之所以关注到数据分析行业,是大学毕业前,跟同学次偶然交谈中,得知了数据分析这个职业,发现自己似乎比较感兴趣,当时也不想做建筑,就决定孤注一掷,all in 数据分。接下来,我就来说说我的经历。

1、择业方向

数据分析行业主要有两个求职方向:偏技术型数据分析师和偏业务性数据分析师。

技术型分析师更接近于数据挖掘工程师、算法工程师、大数据工程师这种概念,一般来说是需要比较好的数据结构知识和算法知识,对于非计算机专业的同学,转型会有一定难度。

第二种就是偏业务型的数据分析师,也是市面上岗位最多的数据分析师,这种分析师的门槛会相对比较低一点,但做不好的话,很有可能就变成报表分析师,提数分析师。不过毕竟门槛还是比较低的,对于想转型的同学,业务型数据分析师会更加友好一些。

明确了转型方向后,对于从零转型的同学来说,会有两个比较迫切的问题,我该从什么地方下手和我简历上啥都没有怎么办。

2、掌握工具和分析技能

对于第一个问题,我的选择是先列了一个我认为的业务型数据分析师所需要的能力矩阵,再针对性准备,简单来说主要包括这几个层面:

1)基本工具

数据分析师三板斧:Excel、SQL、python是数据分析师必知必会的3个基本工具,下面我们一个个来看:

Excel:对于Excel的学习,如果你的意向的岗位不是那种纯excel的数据分析师岗位的话,建议大家不需要花费太多时间在excel上,我个人是几乎没花什么时间在excel上,主要的是要掌握vlookup、透视表和一些常用图表,不会的函数就直接百度。

SQL:核心!sql一定要熟,笔试基本必考,面试时候大概率让你手撕sql,写不出的话很容易凉凉。对于sql的学习,完全没有基础的同学可以先看这本《sql必知必会》,了解sql的一些基本知识,增改删查,主要看查询的部分。看完这本书后你对sql的语法应该有了一些基本的了解了。

Python:相对上面两个工具,python的学习难度会稍微大一些。python能干很多事,对于数据分析师来说,主要应掌握基础语法和数据科学的模块,主要包括pandas numpy 和机器学习库sklearn等,有同学可能会问业务型数据分析师也需要会算法吗?答案是虽然不是必须项,但是加分项,尤其是在从零转型情况下,是增加自己份量的一个筹码。

2)关于Python的看法

对于python的学习,建议大家不要报班交智商税,在coursera上有大把的资源,我学习的是密歇根大学的python课程《Python for everybody》,看完入门的话不是问题,课程是免费的。

学完这个课程你对python就有基本的了解了,但和sql一样,还是需要多练多运用才能真正融汇贯通。那么怎么练习python呢,在这里推荐一个可能很多人都知道的数据竞赛平台,没错就是kaggle,相信不少人都看过泰坦尼克号生存预测这个项目,这个项目的来源就是kaggle。在kaggle上打比赛,既能让你练习python,又能让你有一些项目可以放到简历上,一举两得。

3、数据分析理论知识

统计学和机器学习两手都要抓、两手都要硬。理论知识这块,数据分析师最需要掌握知识是统计学和机器学习,但掌握到什么程度、掌握哪些领域,还是有些门道。

1)统计学

如果不是统计学专业的同学,一般面试官心里都有数,不会问你很难的问题,大学统计学范畴。对于统计学基础不怎么好,或者已经忘干净的同学,可以看网易公开课里可汗学院的课程恶补一下,我在准备的时候复习了一遍,感觉效果不错,捡回了不少遗忘的知识。

2)机器学习

机器学习相关的知识学习成本会比较高,对某些同学来说可能会有一定难度,但对于业务型数据分析师来说,一般不会要求你去推导算法公式,能做到明白不同算法的适用场景、优缺点、原理大概懂就基本可以了。

3)书籍

阅读书籍可以帮助你更好的把知识沉淀下来,除了上面视频课程之外,我还刷了2本书籍。第一本是西瓜书,第二本书是李航的统计学习方法,这两本就不用多说了,经典读物。内容可以挑着看,主要看一下常用的机器学习模型,svm、随机森林之类的。

4、数据分析项目实战

kaggle打的好,工作也好找。如果你已经学完了上面的python和机器学习课程的话,就可以进入实战阶段了,我的选择是去打比赛,既可以巩固学到的知识同时又可以解决简历中没有相关项目的问题。

打比赛和真实的数据分析工作其实非常接近,对于大部分常规数据科学比赛而言(比如泰坦尼克号/房价预测这种),大部分人的模型最后其实都大差不差,lgb/xgb搞一搞,再做个模型融合,决定成绩好坏的关键往往是在特征工程上,有时候一个magic feature就能让你的排名上升数百名。

magic feature从何而来?是来自你对比赛业务的理解,只有你真正理解了业务,才能构思出好的特征,从而取得好的名次,这个业务型数据分析师的本质也是相通的,理解业务,改进业务。

我举个简单的例子,以我做的信用卡风险项目为例,比赛目标是根据用户的个人信息和一些行为数据来判断用户是否会违约。其中有一个特征是用户的工资,第二个特征是用户信用卡已使用的额度,从业务的角度考虑,如果一个用户使用信用卡的额度远高于他的工资,那么这个用户是不是很有可能就没有钱还信用卡,违约风险会比较大?

基于这个假设,我设计了一个 信用卡使用额度 / 工资的特征,经过可视化发现,确实是这个比值越大,用户违约的风险就会越高,把这个特征放到模型里面,我的模型分数有了显著的提高。

这个就是一个基于业务理解做出假设、通过数据验证假设、改进业务的闭环,这也是你在面试中,应该向面试官表达的。

5、数据分析思维

分析思维是数据分析师最最核心的竞争力,上面所学习的python、sql、机器学习知识等都是在工具层面,要想使用好他们,还需要分析思维的驾驭。在面试中,对分析思维的考察也是相当重要的一环。

分析思维:我看过的且比较推荐的书包括:《精益数据分析》、《增长黑客》、《数据化管理:洞悉零售及电子商务运营》、《数据挖掘与数据化运营实战 思路、方法、技巧与应用》;

产品思维类:推荐:《从点子到产品:产品经理的价值观与方法论》、《俞军产品方法论》、《产品思维》

逻辑思维类:《金字塔原理》、《学会提问》、《麦肯锡思维》

看完这些书,我相信你已经具备了基本的数据分析思维。但书中的知识和实际工作毕竟还是有一些差距,在这里我结合我的工作经验,给大家列几个数据分析师真实工作场景中常遇到的问题。

假设抖音的人均活跃时长下降了,你该如何分析这个问题?

网易云音乐之前有一个每天给你推10首歌的功能,如果让你设计指标来衡量这个功能的效果,你会设计哪些指标

很多信息流app在新用户第一次注册时,都会让他们去选择兴趣标签,如果想让你做这个功能的专题分析,你会怎么设计你的报告框架?

最后,希望大家都能找到理想的工作。

文章来源:网络 版权归原作者所有

上文内容不用于商业目的,如涉及知识产权问题,请权利人联系小编,我们将立即处理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值