用python对多组变量绘制箱线图,上图是对链接页面信息做可视化分析的结果,一个点是一个链接
其中,左边是绘制了IsVarient为0和1的优惠券coupon的箱线图,右边绘制了IsVarient为0和1的促销折扣deal的箱线图.
可以得到三点信息:
-
总的来看极少部分的链接会做促销和优惠券,这与我们平时看网页情况不同,因为又优惠券和促销的总是会优先推给消费者。
-
IsVarient为0时,链接做大额促销的很少,运营打法总是会把几个链接放在一起,然后做促销,充分利用流量。
-
高额coupon会比高额促销更普遍
代码及解释
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
import seaborn as sns
import os
fig = plt.figure()
ax1 = fig.add_subplot(1,2,1)
ax2 = fig.add_subplot(1,2,2)
#是否变体和促销
sns.boxplot(x = 'IsVarient',y = 'coupon',data = df, ax = ax1)
sns.boxplot(x = 'IsVarient',y = 'deal',data = df, ax = ax2)
这段代码是使用Python中的matplotlib和seaborn库来创建两个箱形图(boxplot),用于展示数据集中两个变量之间的关系。以下是对代码中各个部分的解释:
-
导入必要的库:
pandas
:用于数据处理和分析。numpy
:用于数值计算。matplotlib.pyplot
:用于绘图。matplotlib
:提供更多绘图功能。seaborn
:基于matplotlib的高级绘图库,提供更美观的图表。os
:用于与操作系统交互,例如文件路径操作。
-
创建一个图形对象:
- 使用
plt.figure()
创建一个新的图形对象fig
。
- 使用
-
添加两个子图:
- 使用
fig.add_subplot(1,2,1)
在图形对象中添加第一个子图ax1
。 - 使用
fig.add_subplot(1,2,2)
在图形对象中添加第二个子图ax2
。 - 参数
1,2
表示整个图形被分为1行2列,1
和2
分别表示第一个和第二个子图的位置。
- 使用
-
绘制箱形图:
- 使用
seaborn
的boxplot
函数在第一个子图ax1
上绘制箱形图,其中x
参数为分类变量'IsVarient'
,y
参数为数值变量'coupon'
,data
参数为数据框df
。 - 同样,在第二个子图
ax2
上绘制箱形图,变量与第一个子图相同,只是y
参数变为'deal'
。
- 使用
-
箱形图解释:
- 箱形图是一种用于展示数据分布的图表,特别是用于显示数据的中位数、四分位数和异常值。
- 每个箱形图的中心线表示中位数,箱子的边界表示第一四分位数(Q1)和第三四分位数(Q3),箱子外的线(通常称为“胡须”)表示数据的范围,不包括异常值。
- 异常值通常用点表示,位于胡须之外。
-
变量解释:
'IsVarient'
:这个变量可能表示产品是否为变体(例如,同一产品的不同颜色或尺寸)。'coupon'
和'deal'
:这两个变量可能表示与促销活动相关的折扣金额或折扣率。
这段代码的目的是比较不同变体('IsVarient'
)的产品在优惠券('coupon'
)和交易('deal'
)方面的差异。通过比较两个箱形图,可以观察到变体产品和非变体产品在促销活动上的分布情况,例如,是否有显著的价格差异或异常值。