目录
大数据和人工智能时代,数据分析是个热门话题,数据分析师貌似也是个热门职业。很多门外汉想学,但面对浩瀚繁杂的技术,也搞不清该从哪里开始。于是,经常有人问这个问题,当然还有问得更具体的,怎么能学会SQL啊,要不要学Python啊,其实背后经常都是一回事。
这里刻意把“处理”也挂上,因为数据分析并不会单独存在,用来分析的数据常常还需要自己去准备去整理,这些都是数据处理的范畴。比如把一堆Excel给合并起来,也许下一步的任务就是分析了,但这一步却少不了。还有些事情,比如用花名册生成员工卡,说成是数据分析显然不太合适,但这也是日常工作中要干的活。这个贴子就把这种折腾数据的事都放一起说了。
另外,这是个面向门外汉的话题,讲到能进入专业状态之后就不能再说了,之后相关的技术更多更繁,但能走到那一步的同学,自己都门儿清了,用不着再看这个贴子的唠叨了。
还要特别强调一点,数据分析并不只是个技术问题,甚至可以说主要问题并不在技术。有很多同学可能认为只是掌握一些相关的技能后就会做数据分析了,这就彻底搞拧了。做好数据分析的重点在于业务知识,也就是你要知道有啥需要被分析。业务经验充分的人用很原始的技术,也常常比毫无业务感觉的人使用高档技术能分析出更多有意义的结果。这就像掌握各种车辆的驾驶只是某种技能,而知道要把货运到哪里能卖出好价钱才是更重要的。用手推车运货,只要运对了地方,有可能会比用汽车运货挣到更多的钱。做数据分析不要迷信技术和工具,如果你本来还不知道做数据分析的业务目的,那学会技术和工具也是白搭。而且,同类同级别的技术和工具通常也差不多,对于数据分析目标而言差别很小(奔驰宝马对于个人乘坐并无区别),刻意选择的意义不大。
言归正传,这篇主要还是讲技术,毕竟掌握技术还是能大幅提高工作效率的。
我们从最基础的讲起:
第0级,Excel
你没看错,人人都会使的Excel就是最基础的数据分析和处理技术,也就因为Excel几乎人人都会使,