《Python数据可视化之美》已经出售,书籍配套的代码也可以在Github-Easy_Shu上下载。但是最近有读者反映代码运行有bug,今天我修正啦,准确的叫法应该是更新。因为这个bug是因为pandas包更新导致原category数据类型的转换方法失效。但是这个数据类型的转换在很多图表代码中都有使用,极为重要,特此郑重声明,希望读者尤为注意。
现在以《Python数据可视化之美》第20页代码为例。一个分类数据不仅包括分类变量本身,还可能包括变量不同的类别(即使它们在数据中不出现)。分类函数pd.Categorical()用下面的选项创建一个分类数据。对于字符型列表,分类数据的类别默认依字母顺序创建:[Fair,Good, Ideal, Premium, Very Good]。
对于已经创建的分类数据或者数据框,可以使用*.astype()函数指定类别选项来覆盖默认排序,从而将分类数据的类别更改为[Good, Fair, Very Good, Ideal, Premium]。其原代码如下:import pandas as pdCut=pd.Series(["Fair","Good","Very Good","Premium","Ideal"])Cut_Facor2=Cut.astype("category",categories=["Good","Fair","Very Good","Ideal","Premium"],ordered=True)
但是现在的运行出错,其bug显示如下