【问题一】 如何使用union_categoricals方法?它的作用是什么?
合并两个分类列表,比如a = pd.Categorical([“b”, “c”])
b = pd.Categorical([“a”, “b”])
union_categoricals([a, b])
[b, c, a, b]
【问题二】 利用concat方法将两个序列纵向拼接,它的结果一定是分类变量吗?什么情况下不是?
当两个序列排序不同时, 合并后为object.
【问题三】 当使用groupby方法或者value_counts方法时,分类变量的统计结果和普通变量有什么区别?
区别在于, 分类变量会返回所有分类变量的统计结果, 而无论该分类变量是否有值, 而普通变量则不会.
【问题四】 下面的代码说明了Series创建分类变量的什么“缺陷”?如何避免?(提示:使用Series中的copy参数)
这个好像是用Series创建对象的时候存在的问题? 并不仅是分类变量吧, 使用copy = True 可以解决啊.
练习1:
xt1[‘深度c’] = pd.cut(xt1[‘深度’],[0,5,10,15,20,30,50,np.inf], right = False, labels = [‘Ⅰ’,‘Ⅱ’,‘Ⅲ’,‘Ⅳ’,‘Ⅴ’,‘Ⅵ’,‘Ⅶ’])
xt1[‘烈度c’] = pd.cut(xt1[‘烈度’], [-1e-10,3,4,5,np.inf],labels=[‘Ⅰ’,‘Ⅱ’,‘Ⅲ’,‘Ⅳ’])
xt1.set_index([‘深度c’,‘烈度c’]).sort_index()
练习2:
不会啊, 膜拜大佬代码