# Author:Nimo_Ding
'''
按照数据之间的关系,将可视化视图划分为四类:
1、比较:
比较数据间各类别的关系,或随时间变化趋势,例如折线图
2、联系:
变量之间的关系,例如散点图
3、构成:
每个部分占整体的百分比,或随百分比变化,比如饼图
4、分布:
关注单个/多个变量分布情况,比如直方图
'''
# 1、散点图scatter plot,适合展示两个变量之间的关系。
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np
import pandas as pd
# 模拟数据是1000个随机点。
N=1000
x=np.random.randn(N)
y=np.random.randn(N)
# x,y表示坐标,marker表示标记的符号样式。
# plt.scatter(x,y,marker='x')
# plt.show() # matplotlib绘制,呈现长方形
df=pd.DataFrame({
'x':x,
'y':y
})
# sns.jointplot(x="x",
# y="y",
# data=df,
# kind='scatter') # scatter代表散点图、kde代表核密度图、hex代表Hexbin图,是直方图的二维模拟。
# plt.show() # Seaborn绘制,呈现正方形,而且给出了变量的分布情况
# 2、折线图
# 用来表示数据随着时间变化的趋势
import pandas as pd
import matplotlib.pyp