category类型在pandas中是和string,int等类型并列的一种数据类型,中文翻译可以理解为分类。即某些数据的分类可以是有限的。例如:人类只有男性和女性,硕士分为研究生和博士等等。下面,我们开始构建pandas创建category类型的两种方法。
1、创建series时,直接指定为category类
>>> s = pd.Series(["a", "b", "c", "a"], dtype="category")
>>> s
0 a
1 b
2 c
3 a
dtype: category
Categories (3, object): [a, b, c]
2、直接将dataFrame中的某一列指定为category
>>> df = pd.DataFrame({"A": ["a", "b", "c", "a"]})
>>> df["B"] = df["A"].astype('category')
>>> df
A B
0 a a
1 b b
2 c c
3 a a
>>> df.dtypes
A object
B category
dtype: object
哈哈,以上就是python小工具关于category类的创建,下一期将介绍category的具体用法。