一、可视化图有哪些
按照数据之间的关系,可以把可视化图分为4类
- 比较:比较数据间各类别的关系,或者是它们随时间的变化趋势,比如折线图;
- 联系:查看两个或两个以上变量之间的关系,比如散点图;
- 构成:每个部分占整体的百分比,或者是随着时间的百分比变化,比如饼图;
- 分布:关注单个变量,或者多个变量的分布情况,比如直方图。
按照变量的个数,可以分为单变量分析和多变量分析
- 单变量分析:指的是一次只关注一个变量
- 多变量分析:可以在一张图上查看两个变量以上的关系
二、10种常见的视图
1、散点图:将两个变量的值显示在二维坐标中,非常适合展示两个变量之间的关系。
matpoltlib绘制可视化图形用pyplot这个工具包。在使用前需要先进行引用。也可以用seaborn这个工具包,使用前进行包的引用1)plt.scatter(x,y,marker=None) x,y是坐标,marker代表了 标记的符号,选择不同的marker呈现出的符号样式也不同
2)sns.jointplot(x,y,data = None,kind = 'scatter') x,y是data中的下标,data是要传入的数据;一般是DataFrame类 型;kind代表不同的视图绘图方式
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
n = 1000
x = np.random.randn(n)
y = np.random.randn(n)
plt.scatter(x,y,marker='*')
df = pd.DataFrame({'x':x,'y':y})
sns.jointplot(x,y,data = df,kind = 'scatter')
Matplotlib 默认情况下呈现出来的是个长方形。而 Seaborn呈现的是个正方形,不仅显示出了散点图,还给了这两个变量的分布情况
2、折线图:表示数据随时间变化的趋势。
1)在Matplotlib 使用plt.plot()函数
2)在Seaborn中使用sns.lineplot (x, y, data=None)函数。其中x,y是data中的下标,data是要传入的数据,一般是DataFrame类型