参数
pd.qcut(x, q, labels=None, retbins=False, precision=3, duplicates='raise')
x :一维数组或者Serise
q : 表示分位数的整数或者数组,
如果是分位数的整数,例如10用于十分位,4用于四分位如果是分位数数组,例如[0,0.25,0.5,0.75,1]用于四分位数
labels : 数组或者布尔值,默认为none,用于指定每个箱体的标签
如果是数组,长度要与分箱个数一致,比如用四分位数分箱,需要指定四个标签如果为False,则仅返回分箱的整数指示符,即当前数据位于哪个箱子中
rebines :布尔值,可选。 是否显示分箱的分界值。(由于是按照分位数进行分箱,在不知道分位数具体数值的情况下,可以通过这个参数设置显示分界值即分位数的具体数值)
precision:整数,默认3,存储和显示分箱标签的精度。
duplicates:如果分箱临界值不唯一,则引发ValueError或丢弃非唯一
查看分箱结果
pd.cut(id_rfm.R,bins=[-1,0,52,180]).value_counts()
返回切分点
a,b = pd.qcut(df['haha'],retbins=True)
b
>>>array([...])