python输出box_python箱型图的返回值

今天,搞了一天的pyhton箱型图,头昏眼花,所幸终于搞定了,这里主要想记录下python箱型图的25%,50%,75%分位的计算,以及dataframe.boxplot()的返回值。

首先25%,50%,75%分为这些统计参数没法通过箱型图相关的方法得到,也没必要通过这些方法得到,可以直接用dataframe.describe()方法得到,清晰快捷,并且返回值也是dataframe,可以说是非常sweet了。

接下来说说boxplot()的返回值,通过以下的代码(片段)

fig = plt.figure()

box_fig = df_vol_deal.boxplot(return_type = 'dict') #绘制7:00-7:15时间内的小时流量箱型图

fig.tight_layout() #自动调整横坐标,防止重叠

plt.ylabel("各卡口小时流量/veh/hour")

plt.xlabel("time")#我们设置横纵坐标的标题。

x = box_fig['fliers'][0].get_xdata() # 'fliers'即为离群点的标签

y = box_fig['fliers'][0].get_ydata()

print(x)

print('\n')

print(y)

可以得到下面的返回值:

runfile('各卡口流量可视化输出.py', wdir='数据预处理')

[1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.

1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]

[1260. 672. 984. 752. 668. 1116. 684. 864. 1052. 688. 840. 1076.

1700. 1288. 1104. 760. 1172. 1476. 980. 724. 828. 1556. 1532. 996.

896. 1028. 696. 852. 732. 788. 636. 772. 712. 724. 952. 780.

640. 840. 1032. 936. 1088. 1160. 1232. 1708. 644. 1140.]

其中第一个数组,其实我还没搞懂到底是啥意思,我猜测是dataframe中第几列的意思,大家可以继续去搞懂它,因为对我没啥用,就不深究了。

关键还是第二个数组,它返回的就是dataframe该列的离群值,因为前面代码中写了box_fig[‘fliers’][0],也就是0列的离群值的data。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值