开篇前言,问题由来
无论我们是干分析工作的,或者对数据分析充满兴趣
我们都应该明白在数据分析中,最重要的必然是你的逻辑思维和分析框架
优秀的思维模型和业务分析能力,直接关乎着我们分析结果的现实价值。
可是仅仅有了思路还不够,我们还需要使用各类工具把分析变成现实,把数据变成价值!
在数据量不大的时候,我们甚至可以直接利用人工统计和专家经验分析就能解决问题
但在数据量很大,业务背景复杂的情况下,选择更快更高效的工具自然变得异常重要
目前常用的主流分析工具包括几种:Excel、SQL、PowerBI、Tableau、Python
当然还有老牌数据分析软件,SPSS、SAS等等Saas解决方案。
而这个时候,就会遇到一个问题:我们要选择哪种工具?
特别注意的是,这个问题是不可避免的,它来自人类天然的比较心理。
人总是喜欢比较事物,无论这个事物它是什么,只要存在参照物,人都会拿来比较。
什么是工具选择障碍症?
通常来说,我们一般比较工具,首先都是看场景用途的,比如:
SQL,一般包括MySQL或Hive SQL等等,主要用于查询和提取数据库中的数据
Excel和Python,主要用于数据清洗、数据转换,也会处理一些文本数据比如txt、csv,json等等
Python相对于Excel,在数据处理量和速度上有一定优势,而Excel在操作上相对简单不需大量编写代码
Power BI或者Tableau,主要处理中等数量的数据,优势在搭建数据分析管道,快速可视化和输出报告。
SAS和SPSS,主要在特定领域使用较多,比如金融圈、咨询公司等等。
你看,这种比较方式都是我们很自然就会去做到,甚至是下意识的行为。
我们可以在这里轻松列举出工具的应用场景,我们也可以用自己独特的对比方式来整理。
正是这种对比思维,引发工具的不断升级换代,最终导致工具之间覆盖的应用场景重合性越来越高。
就像微信、支付宝之间,快手和抖音之间,长得越来越像是一样的。
用excel能解决的,用Python同样可以处理;用SQL能解决的,用Power BI也能搞定。
加之各种工具的更新迭代速度越来越快,功能越来越全面,现在已经很难说谁比谁差了。
最终工具间彼此可替代性越来越高,我们也很难区分,到底什么场景下用哪个工具更好。
更可怕的是,越来越多的分析人员在工具选择上非常偏执,觉得不用主流工具就是落后,就要挨打?
甚至一味地为了主流工具而放弃原有的工具习惯,为了主流工具而改变分析思路和图表样式。
这种过分追求技术工具的分析,往往会丢掉分析的初衷,甚至忘记了分析的目的。
老海称这种现象是:工具选择障碍症,一种盲目求新求变的心理状态
其实,根本不存在什么主流工具
引用鲁迅先生的逻辑,老海认为:
工具本没有好坏之分,使用的人多了也就成了主流
就像经久不衰的Excel,无论是以前的讲解博客论坛、GIF讲解动画,还是现在的短视频课程、自媒体网课
Excel依靠巨大的使用人群,始终是我们办公和数据表格处理的首选位置。
近些年随着数据科学的发展,加之网络都在热炒Python,甚至出现各种夸张的推广方式
也让Python这门1991就出现的脚本语言,自2004年开始,一举翻身为近些年最热门语言之一。
之后随着商业分析作用越发凸显,像Power BI和Tableal这类商业BI分析产品,也逐渐成为这几年热门工具
所以是否主流,并不是决定我们是否选择哪种工具的理由,更不该过分浪费时间去思考谁强谁弱
谁也无法一直追逐上工具变化的脚步,唯一能成就自己的是经验积累和思维成熟。
最后,老海推荐一个工具原则
谁能更快更直接解决当前问题,我们就选择谁!
不需要去追逐所谓的高级工具和技巧,最关键的是需要掌握足够信息来判断哪种工具更合适。
这就像本草纲目,当我们掌握了“对症下药”,所有的“药物”都将为我所用!
接下来,老海将分享系列实操文章:关于EXCEL、SQL、Power BI与Python的终极对决,让我们彻底从工具选择的思维漩涡中跳出来吧!