目录
系列课程学习目标
- [✔] 了解Python中的可视化库
- [✔] 了解NumPy库的基本原理
- 掌握matplotlib库的绘图方法
- 掌握pandas库的绘图方法
- 掌握seaborn库的绘图方法
- 掌握Bokeh库的绘图方法
- 掌握pyqtgraph库的绘图方法
1. Python可视化库
1.1 简介
使用Python中的扩展库,可以较为轻松的实现数据可视化。一般来讲,Python可视化的实现以numpy库和matplotlib库为基础,除此以外,还有一些其他的可视化库,如pandas库、seaborn库、Bokeh库以及pyqtgraph库等。
1.2 可视化基础NumPy库简介
1.2.1 NumPy库简介
1️⃣NumPy是一个开源的Python科学计算基础库,主要用于数据分析,在进行数据可视化时,常常需要使用到NumPy库中的计算功能。
一般来讲, NumPy库具有以下特征:
- NumPy库中最核心的部分是ndarray对象。它封装了同构数据类型的n维数组,它的功能将通过演示代码的形式呈现。
- 在数组中所有元素的类型必须一致,且在内存中占有相同的大小。
- 数组元素可以使用索引来描述,索引序号从0开始。
- NumPy数组的维数称为秩(rank),每一个线性的数组称为是一个轴(axes)。
- 提供广播功能函数,用于数组间的计算。
- 整合C/C++/Fortran代码的工具。
- 线性代数、傅里叶变换、随机数生成等功能。
NumPy是SciPy、Pandas等数据处理或科学计算库的基础。
2️⃣NumPy数组与标准Python序列之间有两个重要区别:
- NumPy数组在创建时就会有一个固定的尺寸,这一点和Python中的list数据类型是不同的。
- list:数据类型可以不同
- NumPy:数据类型相同
- 在数据量较大时,使用NumPy进行高级数据运算和其他类型的操作更为方便。
2. NumPy库的使用
2.1 NumPy库数组的创建
在NumPy库中创建数组可以使用如下语法:
import numpy as np
np.array
该语句表示通过引入NumPy库创建了一个ndarray对象。
尽管别名可以省略或更改,建议使用上述约定的别名。
🔹创建数组对象,代码如下。
import numpy as np
a = np.array([1,2,3])
print (a)
2.2 numpy数组参数
🔹创建一个多维数组对象,代码如下。
import numpy as np
a = np.array([[1,2,3],[4,5,6],[7,8,9]])
print (a)
该例定义并显示了一个多维数组
🔹显示多维数组的数据类型,代码如下。
import numpy as np
a = np.array([[1,2,3],[4,5,6],[7,8,9]],dtype=complex)
print (a)
该例定义了一个多维数组,并显示其数据类型
2.3 N维数组对象:ndarray
🔹计算A2+B3,其中A和B是一维数组
1️⃣数组对象可以去掉元素间运算所需的循环,使一维向量更像单个数据。
2️⃣设置专门的数组对象,经过优化,可以提升这类应用的运算速度。
3️⃣科学计算中,一个维度所有数据的类型往往相同:数组对象采用相同的数据类型,有助于节省运算和存储空间。
4️⃣ndarray是一个多维数组对象,由两部分构成:①实际的数据②描述这些数据的元数据(数据维度、数据类型等)
二维数组的轴
三维数组的轴
5️⃣ndarray对象的属性
6️⃣ndarray的元素类型
7️⃣ndarray数组的创建方法
- 从Python中的列表、元组等类型创建ndarray数组。
x = np.array(list/tuple)
x = np.array(list/tuple, dtype = np.float32)
当np.array()不指定dtype时,NumPy将根据数据情况关联一个dtype类型。
- 使用NumPy中函数创建ndarray数组,如:arange, ones, zeros等。
- 使用NumPy中函数创建ndarray数组,如:arange, ones, zeros等。
- 使用NumPy中其他函数创建ndarray数组
- 对于创建后的ndarray数组,可以对其进行维度变换和元素类型变换
🔹ndarray数组的维度变换
a = np.ones((2,3,4), dtype = np.int32)
🔹ndarray数组的类型变换
- ndarray对象的索引和切片
一维数组的索引和切片:与Python的列表类似
多维数组的索引
- ndarray数组的运算
1️⃣数组与标量之间的运算
数组与标量之间的运算作用于数组的每一个元素
🔹计算a与平均值的商
🔹对ndarray中的数据执行元素级运算的函数
2️⃣数组与数组之间的运算
🔹广播原则
3.NumPy的相关函数
3.1 NumPy中的nan和inf
nan(NAN,Nan):not a number表示不是一个数字。
①什么时候NumPy中会出现nan:
Ⅰ当我们读取本地的文件为float的时候,如果有缺失,就会出现nan。
Ⅱ当做了一个不合适的计算的时候(比如无穷大(inf)减去无穷大)。
inf(-inf,inf):infinity,inf表示正无穷,-inf表示负无穷
②什么时候回出现inf包括(-inf,+inf):
比如一个数字除以0,(python中直接会报错,numpy中是一个inf或者-inf)
-
两个nan是不相等的
-
np.nan!=np.nan
-
利用以上的特性,判断数组中nan的个数
-
由于2,那么如何判断一个数组是否为nan?
通过np.isnan(a)来判断,返回bool类型
比如希望把nan替换为0 -
nan和任何值计算都为nan
3.2 NumPy的统计函数
🔹ndarray缺失值填充均值
3.3 NumPy的随机数函数