前言:对于初学者来说,Python 是一个不错的语言,Python 语言简单易懂,而且有着丰富的数据库以及活跃的社区,对于大数据分析有很明显的帮助。学 Python 数据分析的,好好看我长篇文章。
Numpy
NumPy 软件包是 Python 生态系统中数据分析、机器学习和科学计算的主力军。它极大地简化了向量和矩阵的操作处理。Python 的一些主要软件包(如 scikit-learn、scipy、pandas 和 tensorflow)都以 NumPy 作为其架构的基础部分。除了能对数值数据进行切片(slice)和切块(dice)之外,使用 NumPy 还能为处理和调试上述库中的高级实例带来极大便利。
本节将介绍使用 NumPy 的一些主要常见方法,示例讲解如下。
创建、修改 array、shape 与 reshape 函数
>>> # 导入 numpy
>>> import numpy as np
>>> a = np.array([1, 2, 3])
>>> b = np.array([[1, 2, 3], [4, 5, 6]])
>>> a.dtype
int32
>>> b.shape
(2 3)
>>> 将 b 的第一行第一列的 5 改为 10
>>> b[1,1]=10
>>> b
array([[ 1, 2, 3],
[ 4, 10, 6]])
>>> b.reshape(3,2)
array([[ 1, 2],
[ 3, 4],
[10, 6]])
函数 shape 属性获得数组的大小,通过 dtype 获得元素的属性。如果你想对数组里的数值进行修改的话,直接赋值即可,注意下标是从 0 开始计的。
数组切片和选取
Numpy 的切片和 Python 列表完全一样。一个完整的切片表达式包含两个“:”,用于分隔三个参数(start_index、end_index、step),当只有一个“:”时,默认第三个参数 step=1。
如下图所示,以 a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 为例: