利用Python进行数据分析中有两个重要的库是Numpy和Pandas,本章将围绕这两个库进行展开介绍。
Numpy库
Numpy最重要的一个特点是就是其N维数组对象,即ndarray,ndarray是一个通用的同构数据多维容器,其中的所有元素必须是相同类型的。每个数组都有一个shape(一个表示各维度大小的元组,即表示有几行几列)和dtype(一个用于说明数组数据类型的对象)。本节将围绕ndarray数组展开。
- Numpy基础
(1)创建ndarray数组
使用array函数,它接受一切序列型的对象,包括其他数组,然后产生一个新的Numpy数组。
嵌套序列将会被转换成一个多维数组。
- np.array会尝试为每一个新建的数组推断出适合它的数据类型。
- arange是Python内置函数range的数组版。
(2)数据类型
dtype是一个用来说明数组的数据类型的对象。其命名方式是一个类型名(float和int)后面跟一个用于表示各元素位长的数字。常用的是float64和int32.
也可以使用astype进行数组中数据类型的转化。
(3)基本的索引和切片
①元素索引、根据元素在数组中的位置来进行索引。