用pandas实现固定区间的数据频数统计(pd.cut,pd.Series)

最新推荐文章于 2024-05-08 14:31:23 发布

FionaVivan

最新推荐文章于 2024-05-08 14:31:23 发布

阅读量6.1k

点赞数 6

分类专栏： Python dataframe 文章标签： python

本文链接：https://blog.csdn.net/weixin_37665577/article/details/106768190

版权

Python 同时被 2 个专栏收录

4 篇文章 0 订阅

订阅专栏

dataframe

1 篇文章 0 订阅

订阅专栏

搜罗了一圈，终于找到了能够实现目的的代码

目标：对一组序列进行频数的统计，画出来就像hist，不过我要的是每个bin和对应的数据而不是图，而生成固定区间，我好进行后面的比值对比

首先具有数据分类功能的有：
groupby：分组
count :统计某个元素的频数
unique：不重复的元素
找到最接近的就是np.histogram()
而最终找到方法学习自
这位大神的博客
受教了受教了

a=pd.cut(data_l22_times[0]['Times'],[0,2000,3000,4000,5000,10000,50000],labels=[2000,3000,4000,5000,10000,50000])#先按固定的区间分箱，我没用qcut，用的cut不知道什么区别，但是都能用
a=pd.Series(a, name='Times')
results=pd.Series(data_l22_times[0]['Times']).groupby(a).agg(['count']).reset_index()#groupby提取汇总统计值

结果如下：
在这里插入图片描述
接下来继续愉快地进行后续的操作。

FionaVivan

关注

6
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
用pandas实现固定区间的数据频数统计(pd.cut,pd.Series)

搜罗了一圈，终于找到了能够实现目的的代码目标：对一组序列进行频数的统计，画出来就像hist，不过我要的是每个bin和对应的数据而不是图，而生成固定区间，我好进行后面的比值对比首先具有数据分类功能的有：groupby：分组count :统计某个元素的频数unique：不重复的元素而最终找到方法学习自这位大神的博客受教了受教了a=pd.cut(data_l22_times[0]['Times'],[0,2000,3000,4000,5000,10000,50000],labels=[2000
复制链接

扫一扫