作为一个从超级菜鸟阶段过来的人,也曾迷茫,也曾面对一大堆资料不知所措,从无到有踩过太多的坑,在这里分享一下我总结出来的数据分析学习路径,为了让你少走弯路,避免选择困难,能用一本书搞定的我绝不会给你推荐其他多的书。即使是超级菜鸟,只要你认真按照下面的路径进行学习,我保证你能够有所收获。
在我看来,菜鸟入门数据分析所需要学习的内容依次可以分为三个方面:统计学知识、编程技能以及数据分析的方法论。
一、统计学
学习统计学知识并不是让你生啃一本如《统计学原理》或《数理统计》的教科书,如果真是这样,大多数人怕是直接从入门到放弃了。
我一直认为统计理论要与日常生活结合起来,才能理解得更直观、透彻。这本书运用充满互动性的真实世界情节,教给你有关统计学的所有基础知识,如信息可视化、概率计算、几何分布、二项分布及泊松分布、正态分布、统计抽样、置信区间的构建、假设检验、卡方分布、相关与会归等等。
二、编程技能
在学习了一些统计学的基本知识后,进入编程技能的学习,数据分析主要用到的编程技能有Excel、SQL、Python/R(我推荐学Python)。Excel由于大家或多或少都会用,上手也比较容易,在这里不过多讨论。这里主要讨论SQL和Python应该如何进行学习。
SQL
SQL是什么?SQL全称是”查询性能优化(Structured Query Language)”,是一种资料库查询和程式设计语言,用于存取资料以及查询、更新和管理关联式资料库系统。实际业务中要进行数据分析,首先得把数据从数据仓库中提取出来,SQL干的就是这个。
软件安装:
对于刚刚接触SQL的同学,可能装个Mysql都需要花费很多的时间,这里为大家找了两份Mysql的安装指南。
软件装好了,就可以开始学起来了,针对SQL的学习,可以分为入门阶段和进阶阶段。
入门阶段:
推荐书籍:MySQL必知必会
对入门者很照顾的一本书,与其说是一本书不如说是一本小册子,不到250页的小册子,实践性很强,基本没有什么理论的堆砌,完完全全就是一本实践指南,教会你怎么用SQL语句操作MySQL。看完这本书基本就可以说是入门了。
进阶阶段:
此时的你已经掌握了SQL的基本语法,能对数据库进行基本的增删改查,但当你面对的数据量较大时,优化就显得很重要了。下一步就是要学会如何去优化SQL代码的运行效率。
推荐书籍:高性能MySQL
注意,这本书大家直接看第六章 查询性能优化这章即可,切勿从头啃到尾!!
那么进阶阶段应该如何进行训练呢?答案是Leetcode(一个编程刷题网站)。
Leetcode的数据库板块下面有一些结合实际业务的SQL题目,题目也有划分相应的难度,一开始可以先从难度低的题目开始做起,平台上可以在线编写代码以及在线测试,评论区里面也有一些人的做题思路和代码,当不会做的时候也可以参考一下别人的答案。
当Leetcode的题目练的差不多的时候,你的SQL水平已经足以应付绝大多数的业务场景了。
Python
关于Python,想必我也不用进行过多的介绍,近几年数据分析、人工智能的火热也让Python成为最流行的编程语言,那么小白需要学什么,怎么学呢?
软件安装:
python好用的IDE(简单说就是写代码的平台)有很多,但对于学习数据分析的初学者而言,我还是墙裂推荐你装Anaconda,并使用jupyter作为练手的IDE,听我的错不了!(自己一开始学的时候在命令行那里敲代码,对新手而言体验极差……)
安装好Anaconda并配置好jupyter之后,就可以打开jupyter开始学习Python啦,可以花一点时间稍微熟悉一下jupyter的使用。
基础语法:
安装完软件之后,就可以开始学习Python的基础语法啦,这方面的教程比较多,这里就给大家推荐一下我觉得还不错的,书和视频各一个。
推荐书籍:Python编程从入门到实践
再次注意,这本书也是有选择地看,直接看**第二章(变量和简单数据类型)到第九章(类),**其他的可以直接忽视。建议在看书时,将示例代码全部自己敲一遍,对代码而言,无他,唯手熟尔,待你将第二章到第九章的代码都敲过并理解了之后,你也就基本掌握了Python的主要数据类型,列表、字典、元组的主要操作,条件语句,循环 语句,类和函数的使用,Python也算基本入门了。
Python数据分析核心工具——pandas
当你已经掌握Python的基本语法之后,就可以直接开始学pandas这个数据分析库了,怎么学呢,这里就推荐一本书。
书籍推荐:利用Python进行数据分析 原书第2版
本书由pandas项目创始人Wes McKinney亲笔撰写,详细介绍利用Python进行操作、处理、清洗和规整数据等方面的具体细节和基本要点。不仅有主要方法的操作演示,还有相关案例的实践。把这本书吃透,基本上你就可以灵活地使用Python对数据进行处理了。
其实,如果你认认真真走完上面SQL的学习路径,学习pandas的时候进度会很快,因为很多地方都是相通的,这篇文章总结了pandas和SQL在使用方法上的对比,学完SQL后学pandas,看看这个,你会恍然大悟。
知道你对python感兴趣,所以给你准备了下面的资料~
这份完整版的Python全套学习资料已经上传,朋友们如果需要可以点击链接免费领取或者滑到最后扫描二v码【保证100%免费
】
python学习资源免费分享,保证100%免费!!!
需要的话可以点击这里👉Python学习路线(2023修正版)附涉及资料 (安全链接,放心点击)
文末有福利领取哦~
一、Python所有方向的学习路线
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
二、Python必备开发工具
三、精品Python学习书籍
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、Python视频合集
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
五、实战案例
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
六、Python练习题
检查学习结果。
七、面试资料
我们学习Python必然是为了找到高薪的工作,下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
👉这份完整版的Python全套学习资料已经上传,朋友们如果需要可以扫描下方CSDN官方认证二维码或者点击链接免费领取【保证100%免费
】