使用python(pandas)将数据处理成交叉分组表

最新推荐文章于 2024-01-06 21:03:58 发布

洗手洗红豆

最新推荐文章于 2024-01-06 21:03:58 发布

阅读量6.4k

点赞数 5

分类专栏： python 文章标签： python 数据交叉分组表统计学 pandas

本文链接：https://blog.csdn.net/csuoo/article/details/72526996

版权

本文介绍如何利用Python的Pandas库将数据处理成交叉分组表，通过坐标轴原理理解分组逻辑，并提供详细实现步骤，包括数据分组、cut操作和结果组合，展示Pandas在大数据处理中的高效性能。

摘要由CSDN通过智能技术生成

交叉分组表是汇总两种变量数据的方法, 在很多场景可以用到, 本文会介绍如何使用pandas将包含两个变量的数据集处理成交叉分组表.

环境

pandas
python 2.7

原理

用坐标轴来进行比喻, 其中一个变量作为x轴, 另一个作为y轴, 如果定位到数据则累加一, 将所有数据遍历一遍, 最后的坐标轴就是一张交叉分组表(使用坐标轴展示的数据一般是连续的, 交叉分组表的数据是离散的).

具体实现

示例数据:

quality price
0   bad 18
1   bad 17
2   great   52
3   good    28
4   excellent   88
5   great   63
6   bad 8
7   good    22
8   good    68
9   excellent   98
10  great   53
11  bad 13
12  great   62
13  good    48
14  excellent   78
15  great   63
16  good    37
17  great   69
18  good    28
19  excellent   81
20  great   43
21  good    32
22  great   62
23  good    28
24  excellent   82
25  great   53

代码:

    import pandas as pd
    from pandas import DataFrame, Series
    #生成数据
    df = DataFrame([['bad', 18], ['bad', 17], ['great',

最低0.47元/天解锁文章

洗手洗红豆

关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录