数据分析师,挣钱真野!

作者 | 熊猫教授    整理  | Emma

来源 | 熊猫教授(ID:IT_ProfPanda)

随着AI时代的到来,数据分析师成为职场上的抢手货,工作体面、收入高。许多读者不免好奇:数据分析师,需要怎样的技能呢?自己如何才能培养这些技能呢?今天我来聊聊数据分析师的必备技能吧。

根据数据分析师常见的工作流程,我把能力分为以下几大方面:商业理解和问题分析、数据处理和展示、洞见的产生、团队的合作


1

商业理解和问题分析

上一次咱们提到,数据分析师其主要的工作职责是使用数据、生成洞见、最终帮助领导层做出业务决策。


数据分析项目常见的开始步骤包括,对业务进行深入的理解,并弄清楚如何使用数据驱动的方法解决不同的商业问题。所以在商业理解和问题分析方面,你需要培养并具备相当的能力。

不过说实话,这种能力很难在书本上直接获得。例如,金融业的数据分析和信息安全领域的数据分析就很不一样。金融业侧重的是针对企业财务状况、银行投资风险、客户精准营销等等的分析。


而安全领域侧重的是针对电脑病毒攻击、网络骇客入侵、在线资产欺诈等等的分析。不同行业对具体的数据分析要求也会不同。我建议找一些实习的机会,尝试不同的领域,在每次项目结束后做好总结,记录自己的心得体会,慢慢积累经验。


2

数据处理和展示

说到底,数据分析是一项技术性很强的工作,所以对各种大数据技术的要求还是很高的。由于这个领域发展的太快,所以涌现出很多种类的编程语言和工具,这里我将其中一些整理了一下,大致地为下面几类,供你参考:

一、数据处理

数据处理,最基本的内容就是行话里的ETL,是数据分析工作的基础。而其鼻祖应该是SQL(结构化查询语言)了,它是无处不在的行业标准数据库语言,适用于所有关系型数据库,是数据分析师最基础、最重要的技能之一。


大体上SQL语言需要完成3种功能:数据的定义、数据的操作和数据的控制,而对于数据分析来说,数据的操作是最为重要的。如果你想使用大数据,学习 SQL 也极有可能成为关键的第一步,例如Hive所使用的查询语言HiveQL基本上就是SQL的一种特殊版本。能够运用SQL语言进行查询的工具包括MySQL,微软的SQL Server,Hive等等。

当然,数据处理的进阶版本,应该是能够使用人工智能(AI)和机器学习(Machine Learning )技术进行基本的建模。虽然不是每个数据分析师都需要使用机器学习,但是如果你希望成为行业中的翘楚,那么了解和运用相关的概念以及工具就变得很重要。

机器学习历经了多年的发展,演变出不同的学术流派和丰富的算法模型。比较常见的分类包括监督式学习和非监督式学习。不过,无论哪种流派、哪种模型,都是尝试在数据中找到规律,并将这些规律运用到对已发生的事件进行解释,或者是对未来的可能进行预测,这个时候SQL之类的ETL语言可能就勉为其难了。

可以让你进行人工智能和机器学习实践的工具或平台有很多,例如Spark和Python语言都提供了相关的机器学习包(库),而像TensorFlow和PyTorch之类的语言专门为深度学习提供了便捷的开发舞台。

二、数据展示

对于数据分析师的观点表达来说,使用数据讲述引人入胜的故事是至关重要的。所以在不同的场合,数据分析师都需要使用引人注目的高质量图表,以清晰简洁的方式,合理地展示数据。例如,通过可视化来了解数据的分布,或者通过图表来向业务部门解释所得到的结论。

由于数据展示的重要性,专门的数据可视化学科也应运而生,旨在使用统计图形、图表、信息图表和其他工具,使复杂的数据更容易理解和使用,最终达到清晰有效地传递信息的目的。作为最基本的办公软件,微软的Word和PowerPoint就提供了足够的图表展示功能。

三、处理和展示

你可能会好奇,为什么在之前我们没有提到某些常用的数据处理或者可视化工具。这是因为其中的一些,同时具有处理和展示的能力,我特地将他们总结在第三类。这其中最典型的代表就是微软的Excel。

当我提到Excel 时,你首先想到的可能是电子表格,实际上这个工具内部包含了很多的数据分析能力。你能够使用各种函数和宏进行小规模、快速、准确的分析,更为重要的是,你能很轻松地在数据集上创建各种图表,进行数据的可视化。

如果你在一家初创公司或者非IT行业的公司工作,碰到的第一个数据分析工具很可能就是 Excel。这么多年来,Excel一直是各个行业企业的中流砥柱,而且积累了大量免费的在线资源。

虽然Excel是很好的数据分析入门工具,但是它最大的软肋在于处理数据的规模和速度。如果你需要及时地处理百万级甚至更大量的数据记录,像 R 、SPSS 、SAS、MATLAB、Python和Spark这样的编程环境或者说语言就更加适合了。


R、SPSS 、SAS和MATLAB都自带很强大的分析以及可视化模块,其中R还是免费的。Python和Spark都是从编程语言起家,分别注重于科学计算和大规模并行处理。


好在随着Python生态系统的完善,也出现了很多数据可视化的库,因此也给Python和Spark这类编程环境赋予了数据可视化的能力。另一个需要提到的工具是Tableau,该可视化软件被认为是行业标准的分析工具,其用户友好性确实让人耳目一新。同时,它也允许你连接SQL之类的查询器,可以很容易的将数据分析和可视化结合起来。

虽然说数据处理和展示的技术五花八门,但是这些内容的参考资料非常丰富,你可以选择相应的教科书和在线课程来逐步提升自己的技能。


3

洞见的产生

当我们评价一个数据分析师是否优秀,往往会看一个重要的能力:洞见(insights)生成。简单的说,就是能够根据所分析的数据,得出合理的结论,并给出有价值的建议。当然,要做到这点并不容易。


数据分析师的职责是发现和综合并非总是那么清晰的联系。你可以尝试一些批判性思维的技巧,并记住独立思考,而不仅仅是依赖已经存在的东西。和商业理解与问题分析能力一样,这项能力有很难从书本上学到。


不过,如果你已经具有很深的业务领悟力,过硬的数据处理技术,独立的思维方式,那么你就具有了产生洞见的先决条件。多和行业里有经验的前辈交流,从他们的深刻分析里学习如何进行逻辑性的思考和推理。


4

团队的合作

最后就是团队的合作能力,虽然这点是最后提到的,但它非常非常的重要。这是因为数据分析师的工作往往涉及公司业务的多个环节,需要和不同的部门打交道,熟悉他们的业务内容,整理他们的数据需求,所以跨团队的沟通与协调是必不可少的。

另外,在沟通的过程中,我们还需要注意一个容易被忽视的技巧:演讲。作为数据分析师,要能够在最短的时间里,将复杂的问题说明白,将自己的观点表达清楚,最终获得合作伙伴的认同。同样,这类能力也是需要通过实际的工作经历来打磨,才能得以不断地提升。

总的来说,数据分析师需要具备相当的数据科学知识,一定的数据操作技能,同时对自己所处的行业非常了解,可以将所学的技术运用其上,对现象进行解释,最终为公司决策给出合理的方向。如果你对这个岗位有兴趣,不妨从这些方面入手,多多学习,一定会有所收获。


作者简介熊猫教授,一位定居美国的计算机科学家,交大计算机博士,发表过20多篇国际论文和30项国际专利。曾任职于微软、IBM、eBay,出版过四本技术畅销书,极客时间3万畅销专栏作者。

  -- END --  


老K推荐你关注熊猫教授,一个有趣的计算机博士!


大家在看:

1.“伪高管”如何搞垮公司?

2.他是Linux之父,曾拒绝乔布斯

3.叮咚上市,同事财富自由了!

4.如何用敏捷搞垮一个团队?

5.程序员怎样写出搞垮公司的代码?

6.阿里彻底拆中台了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值