python的一个比较大的功能就是数据处理,我们耳熟能详三个工具包分别是NumPy、Pandas以及Matplotlib,其中NumPy用于提供高级的数值编程以及复杂的数据处理任务;Pandas用于数据读取以及数据预处理等工作;Matplotlib用于绘图,完成可视化的工作。
我们现在从NumPy开始,介绍这几个工具的基本用法。
NumPy的ndarray:一种多维数组对象
NumPy最重要的一个特点就是其N维数组对象(即ndarray),该对象是一个快速而灵活的大数据集容器。在ndarray内部是由以下部分组成的:一个指向数组的指针;数据类型(dtype);一个数组形状(shape)的元组;一个跨度元组,其中的整数指的是为了前进到当前维度下一个远足需要跨过的字节数。
什么是跨度元组呢?
比如创建一个(4,3)的二维数组,学习C语言的时候我们都有一个概念,就是在计算机中,我们的数组不管是多少维的,其在计算机中都是以一维的形式存储的。如果我们这个4*3的数组中存放的是64位的,那么从(4,1)到(