qcut这个函数就挺迷的,今天运行之前的代码居然报错了,报错信息如下:
ValueError: Bin labels must be one fewer than the number of bin edges
原本的代码如下:
#这块代码有的时候运行可以,但有的时候就报错了
pd.qcut(data,4,duplicates="drop")
解决办法:
pd.qcut(data.rank(method="first"),4)
然后就欧克了。
当数据里面重复值过多的时候,其实不是很建议使用qcut函数,这个函数的使用过程中容易有各种各样的bug,可以先计算分位数,然后自己分组。