seaborn库各个画图函数使用实例

 前言:

以下均使用anaconda的notebook环境进行编写,数据和源代码均能找到

链接:https://pan.baidu.com/s/1ggSmjI7aOB7CqbDmVfvw0A
提取码:x4kv

通过anaconda的notebook 打开 Utitled.ipynb,有所有代码

1、seaborn的出现

x = np.random.normal(size=100)
sns.distplot(x,kde=False)

seaborn是matlibplot.pyplot的封装。seaborn有各种画图函数,其丰富的生态系统以及良好的画面感,使得seaborn越来越受用户们的青睐。

 

2、seaborn的使用

import seaborn as sns

通过使用sns调用函数就能完成数据可视化

如果画图中需要使用数据,通过sns.load_dataset("文件名不加后缀")来加载需要的变量数据

 

3、seaborn函数实例(有图片)

1)、使用柱形图

x = np.random.normal(size=100)
sns.distplot(x,kde=False)

Out:

2、使用点图

mean, cov = [0, 1], [(1, .5), (.5, 1)]
data = np.random.multivariate_normal(mean, cov, 200)
df = pd.DataFrame(data, columns=["x", "y"])
# df
sns.jointplot(x="x", y="y", data=df);

Out:

tip:当点过多,使用下面这个进行数据可视化

x, y = np.random.multivariate_normal(mean, cov, 1000).T
with sns.axes_style("white"):
    sns.jointplot(x=x, y=y, kind="hex", color="black")

3、进行多变量分析

自动将以下iris数据集(类型dataframe)统计各个变量之间的关系

iris = sns.load_dataset("iris")
sns.pairplot(iris)
print (iris)

 

4、线性回归分析图(与点图相似)

有两种函数,implot与regplot

tips = sns.load_dataset("tips")
# can load data on the Internet or from the dist
print(tips.head())
with sns.axes_style('white'):
    sns.regplot(x='total_bill',y='tip',data=tips)

regplot相较于implot,没有implot功能丰富,如下例所示:

sns.lmplot(x='total_bill',y='tip',col='day',data=tips,col_wrap=2)

5、分布散点图

sns.swarmplot(x='day',y='total_bill',data=tips)
print (tips.head())
sns.swarmplot(x='day',y='total_bill',hue='sex',data=tips)

 6、盒图

sns.boxplot(x="day", y="total_bill", hue="time", data=tips);

7、小提琴图

sns.violinplot(x="day", y="total_bill", hue="sex", data=tips, split=True);

扩展:

sns.violinplot(x="day", y="total_bill", data=tips, inner=None)
sns.swarmplot(x="day", y="total_bill", data=tips, color="w")

8、条形图

# 显示值的集中趋势可以用条形图
sns.barplot(x="sex", y="survived", hue="class", data=titanic);

9、热力图

uniform_data = np.random.rand(3, 3)
print (uniform_data)
heatmap = sns.heatmap(uniform_data)

 

flights = sns.load_dataset("flights")
print (flights.head)
flights = flights.pivot("month", "year", "passengers")
print (flights.head())
ax = sns.heatmap(flights)

通过添加linewidths,可辨识度更高

ax = sns.heatmap(flights, linewidths=.5)

 

 4、总结

       不管是numpy,pandas,还是matlibplot,seaborn数据可视化库,其最终目的只是为了帮助我们进行有效的数据分析。所以比起记各种库的使用,更重要的是我们要掌握数据是如何分析的。对于数据可视化来说,无非就是x,y轴,只要这两个数据具备,就能画图函数得到理想的图像,其余一般只是细节上面的操作,无伤大雅

       说起这个,如果我拿到了一组数据可以这样做:

1、通过柱形图或盒图来分析单个变量的密集程度以及内部的关系(一个变量)

2、通过折线图、点图或线性回归分析等等来判断各个变量之间的关系(两个变量)

3、使用stripplot (分布散点图)、violinplot(小提琴图)或特殊柱形图等等来反映三个变量之间的关系,这里一般通过添加           hue=‘dataframe的列名’来实现(三个变量)

4、类似热力图等等很常用的图也值得我们探索。

     另:不同的函数画的图反映的只是数据特征,它们均能表示变量之间的关系

     如:通过点图和盒图都能反映两变量之间的关系,只是侧重点不一样,点图侧重于反映数据的密集型特征,盒图更能反映数据的离散化特点

 

©️2020 CSDN 皮肤主题: 书香水墨 设计师: CSDN官方博客 返回首页
实付0元
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值