问题
【问题一】 如何使用union_categoricals方法?它的作用是什么?
使用union_categoricals需要保证两个categories必须是相同的dtype。作用是把两个union_categoricals连接在一起
【问题二】 利用concat方法将两个序列纵向拼接,它的结果一定是分类变量吗?什么情况下不是?
不一定
s = pd.Series(["a", "d", "c", "a"]).astype('category')
s1 = pd.Series(['1', '2'], dtype='category')
pd.concat([s, s1])
0 a
1 d
2 c
3 a
0 1
1 2
dtype: object
【问题三】 当使用groupby方法或者value_counts方法时,分类变量的统计结果和普通变量有什么区别?
分类变量会转成对应的普通变量
【问题四】 下面的代码说明了Series创建分类变量的什么“缺陷”?如何避免?(提示:使用Series中的copy参数)
cat = pd.Categorical([1, 2, 3, 10], categories=[1, 2, 3, 4, 10])<