面对数据分析三件套的Excel、Python(pandas)、SQL,作为新手入门应该先学哪一个?
当我们去看市面上的这类课程,大部分都是分开独立的,而从心理学上讲,“举一反三”和“触类旁通”都是更高效的学习方法,因此这里十五总结了一个三合一的框架,希望能够帮助大家更快记忆和理解这三件套
1、基本结构
了解三个工具的一致性结构,是进一步理解三者的基础;表、列、行构成了各工具最基本的要素
2、选择单元
选择单元指对列或行进行选择操作的单元,以下是同样一组操作的函数或关键字(下同)
3、筛选与排序
4、统计与集合函数
5、多表操作
多表操作基本上是各个工具中最难的部分之一,这里只是简单列举了同一组操作的函数或关键字,熟练地使用还需要多加练习和理解(如left/right/inner/outer join等)
以上就是Excel、Python(pandas)、SQL最常用的一些方法了,如果熟练掌握了这些内容,基本上能够覆盖80%甚至90%以上的数据操作场景
同时,掌握了这一类学习方法,那么其他一些数据工具也可以用类似的方法同时学习,加快进度的同时互相加深印象,例如Excel图表与Tableau、Excel数据分析工具箱与numpy&scipy等
这里有一些各工具的速查表,可以放在桌面或打印出来放在书桌,关注公众号 青十五 后台回复获取
回复关键词【pandas速查】或【pandas】,获取pandas速查表
回复关键词【mysql速查】或【mysql】,获取mysql速查表