文章目录
数据集和jupyter文件链接:https://pan.baidu.com/s/1O5ukYe41iAO9v_czHbs5CA
提取码:by2a
一、cufflinks介绍
1.1 简介
学过Python数据分析的朋友都知道,在可视化的工具中,有很多优秀的三方库,比如matplotlib,seaborn,plotly,pyecharts等等。这些可视化库都有自己的特点,在实际应用中也广为大家使用。
就像seaborn封装了matplotlib一样,cufflinks在plotly的基础上做了一进一步的包装,方法统一,参数配置简单。其次它还可以结合pandas的dataframe随意灵活地画图。可以把它形容为"pandas like visualization"。
1.2 安装
pip install cufflinks
'''
Collecting cufflinks
Using cached https://files.pythonhosted.org/packages/5e/5a/db3d6523ee870ecc229008b209b6b21231397302de34f9c446929a41f027/cufflinks-0.16.tar.gz
...................................................................................
Successfully built cufflinks retrying
Installing collected packages: retrying, plotly, colorlover, cufflinks
Successfully installed colorlover-0.3.0 cufflinks-0.16 plotly-3.10.0 retrying-1.3.3
'''
1.3 cufflinks包介绍
import cufflinks as cf
print(cf.help())
Use 'cufflinks.help(figure)' to see the list of available parameters for the given figure.
Use 'DataFrame.iplot(kind=figure)' to plot the respective figure
Figures:
bar
box
bubble
bubble3d
candle
choroplet
distplot
heatmap
histogram
ohlc
pie
ratio
scatter
scatter3d
scattergeo
spread
surface
violin
None
1.4 使用方法
使用方法其实很简单,我总结一下,它的格式大致是这样的:
DataFrame.Figure.iplot
-
DataFrame:代表pandas的数据框;
-
Figure:代表我们上面看到的可绘制图形,比如bar、box、histogram等等;
-
iplot:代表绘制方法,其中有很多参数可以进行配置,调节符合你自己风格的可视化图形;
二、cufflinks使用
import pandas as pd
import numpy as np
import cufflinks as cf
# 如果使用online模式,那么生成的图形是有限制的。所以,我们这里先设置为offline模式,这样就避免了出现次数限制问题。
cf.set_config_file(offline=True)
df = pd.read_csv('./PimaIndiansdiabetes.csv')
print(df.shape) #(768, 9)
2.0 条形图 bar
# 随机生成bar 条形图
df1=pd.DataFrame(np.random.rand(12, 4), columns=['a', 'b', 'c', 'd'])
df1.iplot(kind='bar',barmode='stack')
# Pima生成bar 条形图
df.iloc[0:66,0:3].iplot(kind='bar',barmode='stack'