利用Python进行数据分析中有两个重要的库是Numpy和Pandas,本章将围绕这两个库进行展开介绍。
Numpy库
Numpy最重要的一个特点是就是其N维数组对象,即ndarray,ndarray是一个通用的同构数据多维容器,其中的所有元素必须是相同类型的。每个数组都有一个shape(一个表示各维度大小的元组,即表示有几行几列)和dtype(一个用于说明数组数据类型的对象)。本节将围绕ndarray数组展开。Numpy基础
(1)创建ndarray数组
使用array函数,它接受一切序列型的对象,包括其他数组,然后产生一个新的Numpy数组。
嵌套序列将会被转换成一个多维数组。np.array会尝试为每一个新建的数组推断出适合它的数据类型。
arange是Python内置函数range的数组版。
(2)数据类型
dtype是一个用来说明数组的数据类型的对象。其命名方式是一个类型名(float和int)后面跟一个用于表示各元素位长的数字。常用的是float64和int32.
也可以使用astype进行数组中数据类型的转化。
(3)基本的索引和切片
①元素索引、根据元素在数组中的位置来进行索引。一维数组的索引多维数组的索引
②切片索引一维数组的切片索引(与Python列表的切片索引一样)多维数组的切片索引
③花式索引
元素索引和切片索引都是仅局限于连续区域的值,而花式索引可以选取特定区域的值。