#调用cut函数对数据进行处理。pd.cut用于面元划分或离散化。cats=pd.cut(list,bins) bins为传入的区间,可用right=False对右开区间。返回值cats有.levels和label两个。
#其中,cats.levels返回index类型,如[[1,2],[3,4]],如lcats.labels则返回array,如[0,1]
bins=[openF.R3years.min(),0,0.1,0.3,0.5,1,2,openF.R3years.max()]
cats=pd.cut(openF[R3years],bins,right=False)
#print(cats.labels)
#print(cats.levels)
cats
cat.labels及cat.levels是python2.0的用法,在3.0里面已做了更改。
其中,cats是一个返回箱名的字符串数组。cats.codes返回一个一维数组的数值标签,而cats.categoriedd返回一个类型为interval的不同类别名称。
bins=[openF.R3years.min(),0,0.1,0.3,0.5,1,2,openF.R3years.max()]
cats=pd.cut(openF.R3years,bins,right=False)
#print(cats.codes) #无法调用,可能新版本又变了
#print(cats.categories)
s1=pd.value_counts(cats)
attr=s1.index
v1=s1.values
bar = Bar("基金3年收益率个数分布图")
bar.add("基金三年收益率该组个数", attr,v1, xaxis_interval=0, xaxis_rotate=36, yaxis_rotate=0)
bar
新的也无法调用,大概是避免出错吧。不过利用pd.value_counts()可以调用后来数据需要的Index和values,可能这种做法也不错。