介绍
plotly是一个易于使用,功能强大的python绘图库,用于构建可交互式的图表(可以自行运行后使用鼠标拖拽图片试试),本系列文章将介绍plotly绘制各种类型图的方法,本文将介绍——箱型图
箱型图
基础箱型图
代码解释
-
import plotly.express as px:
这一行代码导入了plotly.express模块,并给它起了一个别名px。这样做的好处是,在后续的代码中,可以通过px来调用plotly.express中的函数,而不需要每次都写出完整的模块名,使得代码更加简洁。 -
df = px.data.tips():
px.data.tips()是plotly.express库提供的一个内置数据集,它包含了关于餐馆小费的数据。这个数据集被赋值给变量df,这样我们就可以使用这个数据集进行数据分析和可视化了。 -
fig = px.box(df, y=“total_bill”):
这行代码使用px.box()函数创建了一个箱线图。箱线图是一种用于展示数据分布情况的图表类型,它能够直观地展示数据的中位数、四分位数以及异常值等统计信息。
df是数据源,即之前导入的餐馆小费数据集。
y="total_bill"指定了箱线图的y轴数据,这里选择了total_bill列,即每个记录的总账单金额。箱线图将会展示总账单金额的分布情况。 -
fig.show():
最后,fig.show()这行代码实际上是将前面创建的箱线图显示出来。fig是前面创建的图表对象,调用show()方法后,会在用户的默认浏览器中打开一个新的标签页,并展示这个交互式图表。
import plotly.express as px
df = px.data.tips()
fig = px.box(df, y="total_bill")
fig.show()
含散点的箱型图
代码解释
- 这段代码使用Plotly库中的plotly.express模块创建了一个箱线图,用于展示餐馆小费数据集中不同时间段(time列)的总账单金额(total_bill列)的分布情况。
- points="all"参数表示在箱线图上显示所有数据点。
- 最后,通过fig.show()将图表显示出来。
import plotly.express as px
df = px.data.tips()
fig = px.box(df, x="time", y="total_bill", points="all")
fig.show()
更改计算四分位数的算法
代码解释
- 这段代码使用Plotly库的plotly.express模块创建了一个箱线图,展示了餐馆小费数据集中不同日子(day列)的总账单金额(total_bill列)的分布情况,并按照是否吸烟(smoker列)进行颜色区分。
- update_traces方法用于修改箱线图的四分位数计算方法,这里指定为"exclusive",意味着箱线图将展示从第一四分位数到第三四分位数的区间,不包括中位数。默认情况下,箱线图使用"linear"方法计算四分位数。
- 最后,fig.show()将创建的图表显示出来。
import plotly.express as px
df = px.data.tips()
fig = px.box(df, x="day", y="total_bill", color="smoker")
fig.update_traces(quartilemethod="exclusive") # or "inclusive", or "linear" by default
fig.show()