Categorical是python的pandas中对应分类变量的一种数据类型,与R中的因子型变量比较相似,例如性别、血型等等用于表示类别的变量都可以用其来表示。
Categorical可以进行排序操作,但不可以进行数值运算操作,其顺序
在其被定义的时候一同确定,而不是按照数字字母词法排序的顺序,其适用场景有如下:
1、具有少数几种可能取值并存在大量重复的字符串字段,利用Categorical类型对其转换后可有效节省内存
2、字段的排序规则特殊,不遵循词法顺序时,可以利用Categorical类型对其转换后得到用户所需的排序规则
欢迎大家转发,一起传播知识和正能量,帮助到更多人。辛苦大家转发时注明出处(也是咱们公益编程交流群的入口网址),刘经纬老师共享知识相关文件下载地址为:http://liujingwei.cn