分类变量的创建及其性质
分类变量的创建:
pd.Series(["a", "b", "c", "a"], dtype="category") #用Series创建
#对DataFrame指定类型创建
temp_df = pd.DataFrame({'A':pd.Series(["a", "b", "c", "a"], dtype="category"),'B':list('abcd')})
temp_df.dtypes
#利用内置Categorical类型创建
cat = pd.Categorical(["a", "b", "c", "a"], categories=['a','b','c'])
pd.Series(cat)
#利用cut函数创建
pd.cut(np.random.randint(0,60,5), [0,10,30,60]) #默认使用区间类型为标签
pd.cut(np.random.randint(0,60,5), [0,10,30,60], right=False, labels=['0-10