先创建一个DataFrame测试
import pandas as pd
import numpy as np
d = pd.DataFrame(np.random.randint(0, 50, (10, 6)),
index=list('ABCDEFGHIJ'),
columns=list('abcdef'))

1、等宽法、将数据划分为n等份
把a列的每一个元素的区间都分出来

展示每一个区间的元素个数

对结果不排序

2、等频法、 以相同数量的记录放进每个区间
qcut()是按照分位数对样本进行划分的,这样划分的结果是的每个区间的大小基本相同,但不一定完全相同。例如把a列分成4等份,就是按照四分位数划分的

本文介绍使用Python的Pandas库进行数据分箱的两种方法:等宽法和等频法。通过实例展示了如何将DataFrame的一列数据划分为多个区间,并讨论了每种方法的特点及应用场景。
893

被折叠的 条评论
为什么被折叠?



