数据可视化
基本概念
数据可视化指的是借助图形化的手段,清洗、快捷、有效的传达与沟通信息。同时,也可以辅助用户做出相应的判断,更好的洞悉数据背后的价值。俗话说,字不如表,表不如图,我们可以通过可视化技术将文字和表转化成图形,这样以来我们就可以轻松的得到字和表想要传递的信息。当前,数据可视化在各个领域都有着很重要的作用,不论是科研还是教育抑或是开发,数据可视化都是极为重要的一块。就比如今年的疫情,技术人员通过数据可视化的手段,将疫情的数据直观的以地图的形式表现出来,哪个地方感染了多少人一目了然,还有热力图等,身边有感染的也会出现在地图上,很简单我们就可以知道哪里人多哪里人少,哪里有感染的人,极大的保障了人身安全。
图形绘制
matplotlib相关
matplotlib是基于Python语言的开源项目,旨在为Python提供一个数据绘图包。
安装
pip install matplotlib
导入
根据惯例,我们使用以下方式导入。
import matplotlib as mpl
import matplotlib.pyplot as plt
绘制线图
可以通过matplotlib.pyplot的plot方法进行图形绘制。
- plot(y)
- plot(y, ‘格式’)
- plot(x, y)
- plot(x, y, ‘格式’)
- plot(x1, y1, ‘格式1’, x2, y2, ‘格式2’ …… xn, yn, 格式n)
参考链接: plt.plot()官网传送门
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib as mpl
x = np.linspace(0,2 * np.pi,num=100)
y =np.sin(x)
plt.plot(x,y,"r--")//红色,虚线
图形交互设置
我们可以设置jupyter notebook图形是否交互式显示,默认为否。
- %matplotlib notebook
- %matplotlib inline
设置中文支持
matplotlib默认情况下不支持中文显示,如果需要显示中文,则我们需要做一些额外的设置操作。设置可以分为:
-
全局设置
-
局部设置
-
全局设置
我们可以通过执行:
mpl.rcParams["font.family"] = "中文字体名称"
mpl.rcParams["axes.unicode_minus"]=False
进行设置。常用的设置如下: -
font.family 字体的名称
- sans-serif 西文字体(默认)
- SimHei 中文黑体
- FangSong 中文仿宋
- YouYuan 中文幼圆
- STSong 华文宋体
- Kaiti 中文楷体
- LiSu 中文隶书
-
font.style 字体的风格
- normal 常规(默认)
- italic 斜体
- oblique 倾斜
-
font.size 字体的大小(默认10)
-
List item
-
axes.unicode_minus 是否使用Unicode的减号(负号)【在支持中文显示状态下,需要设置为False】
-
局部设置
在需要显式的文字中,使用fontproperties参数进行设置。说明:
- 如果全局设置与局部设置冲突,以局部设置为准。
mpl.rcParams["font.family"] = "Kaiti"
mpl.rcParams["axes.unicode_minus"]=False//这里将字体设置成中文后,负号也也会使用中文的,而中文的负号不支持显示,因此我们将负号改成英文的。
mpl.rcParams["font.style"] = "italic"//设置字体的风格,对中文字体无效
mpl.rcParams["font.size"] = 10//设置字体的大小。
plt.plot([-1, -2, -3], [4, 5, 6])
plt.title("title")
注意:
使用mpl.rcParams设置参数时,是一种全局设置,我们也可以进行局部的设置,仅对当前的绘制生效。当全局设置与局部设置冲突时,以局部设置为准。
plt.plot([-1, -2, -3], [4, 5, 6])
plt.title("标题"