04-3 pandas 中 pd.Categorical用法

pandas.Categorical是用于表示类似于R/S-Plus的分类变量的数据结构。分类变量有固定的可能值,且可能带有顺序,但不允许数值运算。值必须在指定的类别中,否则会被替换为NaN。可以通过`values`、`categories`、`ordered`等参数创建。如果`ordered=True`,则分类被视为有序。CategoricalDtype对象记录了数据的类别信息,可以通过`codes`和`categories`属性查看。有序分类可以自定义排序并具有最小值和最大值的概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

pandas.Categorical(values,categories = None,ordered = None,dtype = None,fastpath = False )[source]
表示经典R / S-plus方式的分类变量

分类只能采用有限的,通常是固定数量的可能值(类别)。与统计分类变量相比,分类可能具有顺序,但数值运算(加法,除法,…)是不可能的。

分类的所有值都在类别或np.nan中。在类别之外分配值将引发ValueError。顺序由类别的顺序定义,而不是值的词汇顺序。

参数:

值:类似列表。分类的值,如果给出了类别,则不在类别中的值将替换为NaN。
类别:索引式(唯一),可选。此分类的唯一类别。如果没有给出,则假定类别是值的唯一值。
ordered:布尔值,(默认为False)。此分类是否被视为有序分类。如果没有给出,则不会订购生成的分类。
dtype:CategoricalDtype,CategoricalDtype用于此分类的实例

举:

ValueError异常:如果类别不验证。
类型错误:如果ordered=True给出了显式但没有类别且 值不可排序。
下面我们来看实例:

In [16]: st = ['a','a','b','c','c']

In [17]: 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值