重要的Python库
- NumPy
Numerical Python的简称,它是科学计算的基础包。今后学习的大部分内容都是基于NumPy以及构建于其上的库。它提供了以下的功能(主要的):
- 快速高效的多维数组对象ndarray
- 用于对数组执行元素级计算以及直接对数组执行数学运算的函数
- 用于读写硬盘上数组的数据集的工具
- 线性代数运算、傅立叶变换,以及随机数生成
- 用于将C、C++、Fortran代码集成到Python的工具。
- pandas
Panel Data(面板数据)的简称,它提供了能够快速便捷的处理结构化数据的大量数据结构和函数,它是使Python成为强大而高效的数据分析环境的重要因素之一。今后会用的最多的pandas对象是DataFrame,它是一个面向列的二维表结构,且含有行标和列标。
pandas兼具NumPy高性能的数组计算功能以及电子表格和关系型数据库(如SQL)灵活的数据处理功能。它提供了复杂精细的索引功能,以便更为便捷地完成重塑、切片和切块、聚合以及选取数据子集等操作。
- matplotlib
它是最流行的用于绘制数据图标的Python库。绘制的图标也是交互式的,可以利用窗口中的工具栏方法图标中的某个区域或者对整个图标进行平移浏览。
- IPython
它是Python科学计算标准工具集的重要组成部分,它将其他所有的东西联系到了一起,为交互式和探索式计算提供了一个强健而高效的环境。它是一个增强的Python Shell,目的是提高编写、测试、调试Python代码的速度。它主要用于交互式数据处理和利用matplotlib对数据进行可视化处理。
- SciPy
它是一组专门解决科学计算中各种标准问题域的包的集合,主要包括以下这些包:
- scipy.integrate:数值积分例程和微分方程求解器。
- scipy.linalg:扩展了由numpy.linalg提供的线性代数例程和矩阵分解功能。
- scipy.optimize:函数优化器(最小化器)以及根查找算法。
- scipy.signal:信号处理工具。scipy.signal:信号处理工具
- scipy.sparse:稀疏矩阵和稀疏线性系统求解器。scipy.sparse:稀疏矩阵和稀疏线性系统求解器。
- scipy.special:SPECFUN(这是一个实现了许多常用数学函数(如伽玛函数)的Fortran库)的包装器。
- scipy.stats:标准连续和离散概率分布(如密度函数、采样器、连续分布函数等)、各种统计检验方法,以及更好的描述统计法。
- scipy.weave:利用内联C++代码加速数组计算的工具。
NumPy跟SciPy的有机结合完全可以替代MATLAB的计算功能(包括其插件工具箱)。
引入惯例
Python社区已经广泛接受了一些常用模块的命名惯例:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
行话
- 数据规整(Munge/Munging/Wrangling)
指的是将非结构化和(或)散乱数据处理为结构化或整洁形式的整个过程。这几个词已经悄悄成为当今数据黑客们的行话了。
Pycharm可以直接安装库,安装方法如下:
https://blog.csdn.net/bylhjcsmmd/article/details/77530812?locationNum=9&fps=1