seaborn 可视化包:
参考:https://www.douban.com/note/567787081/
http://blog.csdn.net/qq_34264472/article/details/53814653
http://blog.csdn.net/woaidapaopao/article/details/64443474
https://zhuanlan.zhihu.com/p/27435863
import pandas as pd
import numpy as np
import random as rnd
# visualization
import seaborn as sns
import matplotlib.pyplot as plt
设置主题和调色板
sns.set(style='white',palette='muted',color_codes=True)
图片分块:
fig,axes = plt.subplots(1,2,figsize=(7,7))
sns.distplot(df,ax=axes[0],kde=True,rug=True,hist=True,shade=True)
#kde密度曲线;hist柱状图;rug边际毛毯;shade:阴影;
plt.show
核密度估计:
sns.kdeplot(x,shade=True,bw=.2)
jointplot:
mean, cov = [0, 1], [(1, .5), (.5, 1)]
data = np.random.multivariate_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=["x", "y"])
sns.jointplot(x="x", y="y", data=df);
分类散点图:
抖动是平时可视化中的常用的观察“密度”的方法,除了使用参数抖动,特定的抖动需求也可以用numpy在数据上处理实现
sns.stripplot(x="day", y="total_bill", data=tips, jitter=True);#jitter:随机抖动
sns.swarmplot(x="day", y="total_bill", data=tips);#换一种抖~~
sns.swarmplot(x="day", y="total_bill", hue="sex",data=tips);#hue添加多个嵌套的分类变量
箱线图和提琴图
见https://zhuanlan.zhihu.com/p/27683042
factorplot:
sns.factorplot(x="day", y="total_bill", hue="smoker",
col="time", data=tips, kind="swarm");
sns.factorplot(x="time", y="total_bill", hue="smoker",
col="day", data=tips, kind="box", size=4, aspect=\.5);
factorplot的变量名:
x,y,hue 数据集变量 变量名
date 数据集 数据集名
row,col 更多分类变量进行平铺显示 变量名
col_wrap 每行的最高平铺数 整数
estimator 在每个分类中进行矢量到标量的映射 矢量
ci 置信区间 浮点数或None
n_boot 计算置信区间时使用的引导迭代次数 整数
units 采样单元的标识符,用于执行多级引导和重复测量设计 数据变量或向量数据
order, hue_order 对应排序列表 字符串列表
row_order, col_order 对应排序列表 字符串列表
kind : 可选:point 默认, bar 柱形图, count 频次, box 箱体, violin 提琴, strip 散点,swarm 分散点(具体图形参考文章前部的分类介绍)
size 每个面的高度(英寸) 标量
aspect 纵横比 标量
orient 方向 “v”/”h”
color 颜色 matplotlib颜色
palette 调色板 seaborn颜色色板或字典
legend hue的信息面板 True/False
legend_out 是否扩展图形,并将信息框绘制在中心右边 True/False
share{x,y} 共享轴线 True/False