pandas学习笔记1—categories与set_categories

最新推荐文章于 2024-07-14 15:01:59 发布

Lavi_qq_2910138025

最新推荐文章于 2024-07-14 15:01:59 发布

阅读量1.4w

点赞数 7

分类专栏： python Pandas 文章标签： pandas categories

python 同时被 2 个专栏收录

106 篇文章 8 订阅

订阅专栏

Pandas

14 篇文章 2 订阅

订阅专栏

使用pandas的类别相关的方法可以设置和改变数据的类别。

import pandas as pd
import numpy as np

df = pd.DataFrame({"id":[1,2,3,4,5,6], "raw_grade":['a', 'b', 'b', 'a', 'a', 'e']})
#将raw_grade列转化为category类型
df["grade"] = df["raw_grade"].astype("category")
print(df["grade"])

这里写图片描述
可以看到此时类标签的字符a,b,e ；类标签的集合为[a,b,e]
打印类标签的结果如下

#改变类别标签
df["grade"].cat.categories = ["very good", "good", "very bad"]
print(df["grade"])

这里写图片描述
给categories赋值，可以改变类别标签。赋值的时候是按照顺序进行对应的。a对应very good，b对应good,c对应very bad。操作完成之后，原来的标签a就变成了very good标签。
此时类标签的集合为[“very good”, “good”, “very bad”]

#改变类别标签集合，注意和上面的对.categories的操作进行区分。
df["grade"] = df["grade"].cat.set_categories(["very bad", "bad", "medium", "good", "very good"])
print(df["grade"])

改变类别标签集合，操作过后数据的标签不变，但是标签的集合变为[“very bad”, “bad”, “medium”, “good”, “very good”]

#按照类标签在标签集中的顺序排序，而不是安装类标签的字母顺序进行排序
dfnew = df.sort_values(by="grade")
print(dfnew)

这里写图片描述

#根据类标签进行分组
df.groupby("grade").size()

这里写图片描述

参考文章：
pandas小记：pandas高级功能
 Python数据分析库pandas基本操作

Lavi_qq_2910138025

关注

7
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录