如果你是通过学习给程序员设计的 Python 课程来学习 Python 数据分析,那就大错特错了。很多数据分析师在开始学习 Python 数据分析之前就被引导学习 LeetCode 上那些为程序员准备的编程谜题。这对于只需要提取、清洗数据、绘制可视化图、构建模型的数据分析师来说实在是误人子弟,数据分析师要学的不是开发应用软件,而是应该把时间和精力花在学习处理数据的模块与支持库上。请根据以下步骤一步步学习的Python 数据科学。
配置开发环境
Jupyter Notebook 是一个非常强大的开发环境,而且非常适合展示数据分析的结果。
Anaconda 是安装 Jupyter Notebook 最简单的方式,它是现在最流行的 Python 数据科学发行版,预装了很多最流行的支持库。
建议安装 Anaconda 时,选择支持 Python 3 最新版的版本。
安装好 Anaconda 以后,阅读这篇文章学习如何使用 Jupyter Notebook。
呆鸟云:也可以参考 DataCamp 的 Jupyter Notebook 速查表,点击链接可以下载呆鸟为大家精心制作的高清中文版哦!
学些 Python 基础就够了
参考 DataCamp 的 Python 数据科学速查表,即可快速掌握 Python 的基础知识,如果想学习更多 Python 的基础知识,推荐看《Python基础教程(第3版)》。
Numpy 与 pandas 才是数据分析师要学的东西
Python 处理大规模数据,执行数字处理算法其实很慢。听到这里大家可能会问,那你凭什么说 Python 是最流行的数据分析编程语言?
这是因为 Python 有基于 C 与 Fortran 开发的支持库,就