目录
1 Nmupy简介
Numpy(Numerical Python),即数值Python包,是Python进行科学计算的一个基础包,因此要更好理解和掌握Python科学计算包,尤其是Pandas,需要先掌握Numpy库的用法。
Numpy系统是Python的一种开源的数值计算扩展,是一个用Python实现的科学计算包。包括:
(1)一个具有矢量算数运算和复杂广播能力的快速且节省空间的多维数组,称为ndarray(N-dimensional array object);
(2)用于对整组数据进行快速计算的标准数学函数,ufunc(universal function object);
(3)用于整合C/C++和Fortran代码的工具包;
(4)实用的线性代数、傅里叶变换和随机数生成函数。Numpy和稀疏矩阵运算包scipy配合使用更加方便。
(1)genfromtxt函数
(2)如何将.csv文件数据直接读取为numpy array型数据(np.genfromtxt()函数)
Python 并没有提供数组功能,虽然列表 (list) 可以完成基本的数组功能,但它并不是真正的数组,而且在数据量较大时,使用列表的速度就会慢的让人难受。为此,Numpy 提供了真正的数组功能,以及对数据快速处理的函数。Numpy 还是很多更高级的扩展库的依赖库,例如: Scipy,Matplotlib,Pandas等。此外,值得一提的是:Numpy 内置函数处理数据的速度是 C 语言级别的,因此编写程序时,应尽量使用内置函数,避免出现效率瓶颈的现象。一切计算源于数据,那么我们就来看一看Numpy.genfromtxt 如何优雅的处理数据。
import numpy as np import matplotlib.pyplot as plt f = open('test1.csv', 'w') f.write("1,1.2\n2,2.2\n4,4.5\n7,8.9") f.close() data = np.genfromtxt('test1.csv', delimiter=",") x_data=data[:,0] y_data=data[:,1] print(data.shape) print(x_data) print(y_data) plt.scatter(x_data,y_data) plt.show()
(4, 2) [1. 2. 4. 7.] [1.2 2.2 4.5 8.9]
2 数据类型
3 数组计算
3.1 算术运算
3.2 比较及聚类函数
3.3 数组复制及排序