Python数据分析流程:
NumPy、SciPy、Pandas和Matplotlib库共同构成了Python数据分析的基础。
Python中两个非常重要的库Numpy和Pandas也是需要掌握的,我们的很多数据处理及分析方法就源于其中。
SciPy可以处理插值、积分、优化、图像处理、常微分方程数值解的求解、信号处理等问题。它用于有效计算Numpy矩阵,使Numpy和Scipy协同工作,高效解决问题。
Python中的Matplotlib库提供了强大的可视化功能。
Python生态系统为数据分析师和数据科学家提供的常用程序库如下:
●NumPy:这是一个通用程序库,不仅支持常用的数值数组,同时提供了用于高效处理这些数组的函数。
Numpy知识框架:
●Spicy:这是Python的科学计算库,对NumPy的功能进行了大量扩充,同时也有部分功能是重合的。Numpy和SciPy曾经共享基础代码,后来分道扬镳了。
Scipy是由针对特定任务的子模块组成:
●Pandas:这是一个用于数据处理的程序库,不仅提供了丰富的数据结构,同时为处理数据表和时间序列提供了相应的函数。
Pandas知识框架:
●Matplotlib:这是一个2D绘图库,在绘制图形和图像方面提供了良好的支持。当前,Matplotlib已经并入SciPy中并支持NumPy。
Matplotlib可用于Python脚本,Python和IPython shell,Jupyter笔记本,Web应用程序服务器和四个图形用户界面工具包
简单图形绘制:
import matplotlib.pyplot as plt
plt.plot([1,2,3])
plt.ylabel('some numbers')
plt.show()
●IPython:这个库为Python提供了强大的交互式Shell,也为Jupyter提供了内核,同时还支持交互式数据可视化功能。
安装的Anaconda中包含了IPython,因此不需要再而外安装。
IPython为交互式计算提供了一个丰富的架构:
- 强大的交互式shell
- 供Jupyter notebooks使用的Jupyter内核
- 交互式的数据可视化工具
- 灵活、可嵌入的解释器
- 易于使用,高性能的并行计算工具
- 常用的键盘快捷键:
●Jupyter Notebook:它提供了一个基于Web的交互式shell,可以创建和共享支持可实时代码和可视化的文档。Jupyter Notebook通过IPython提供的内核支持多个版本的Python。
Jupyter Notebook和IPython Notebook之间有什么关系或者说区别?
从结论上来说它们是同样的东西。
简单来说Jupyter Notebook 脱胎于 IPython Notebook ,最开始Jupyter Notebook的名字就是IPython Notebook,只是后来对应了除Python以外的越来越多的编程语言,所以后来改成了Jupyter Notebook。
参考资料:
1.Python数据分析,学习路径拆解及资源推荐(附详细思维导图) - DataCastle的文章 - 知乎 https://zhuanlan.zhihu.com/p/58445725
2.七月在线:Python和数据分析入门:登录 - 七月在线
登录 - 七月在线www.julyedu.com3.从零开始用Python3做数据分析:
https://blog.csdn.net/qq_42083988/article/details/80389117blog.csdn.net人生苦短,我用Python!
ps:初步学习,有问题欢迎指出,相互学习!