分类变量如何设置变量值的显示顺序

最新推荐文章于 2022-05-21 12:17:40 发布

毛飞龙

最新推荐文章于 2022-05-21 12:17:40 发布

阅读量1.2k

点赞数

分类专栏： Python 数据分析文章标签： pd.Categorical 分类变量设定顺序

本文链接：https://blog.csdn.net/weixin_41140174/article/details/103438801

版权

Python 同时被 2 个专栏收录

43 篇文章 7 订阅

订阅专栏

数据分析

29 篇文章 5 订阅

订阅专栏

在做数据分析的时候，有时候分类变量值默认的排序不是我们想要的，需要调整显示顺序，pandas可以通过pd.Categorical来设置分类变量的显示顺序。

例如，对于数据分析教程常用的diamonds数据集，color等级是从J, I, H, G, F, E, D逐渐上升，如果要考察color等级和价格的关系，自然是希望color按照J, I, H, G, F, E, D顺序显示，但数据默认会按照字母（变量值）在数据中出现的顺序或者一般排序的顺序。

例如：直接绘图，color的显示顺序为变量值在数据中出现的顺序

import seaborn as sns 
sns.barplot(x = "color", y = "price",data = diamonds)

现在通过pd.Categorical()函数重新设置color列的显示顺序

color_cats = ['J', 'I', 'H', 'G', 'F', 'E', 'D']
diamonds['color'] = pd.Categorical(diamonds['color'], categories=color_cats, ordered=True)

设置完毕后，显示顺序就按照等级顺序了。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

毛飞龙

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

将分类变量与顺序变量转化未标志变量——20190705

if7love的博客

07-13

2591

一、分类数据/变量VS顺序数据/变量的定义分类数据：分类数据指某些数据属性只能归于某一类别的非数值型数据，例如性别男和女就是分类数据。注意：分类数据没有明显的高/低/大/小等包含等级/顺序/排序/好坏等逻辑的划分。只是用来分区两个或者多个具有相同或相似价值的属性。顺序数据：只能归于某一有序类别的非数值型数据，例如学历：小学/初中/高中/大专/本科/研究生等，这个是有明显的排序规律和逻辑...

python 分类变量xgboost_xgboost 多分类标签怎么设置？

weixin_39716105的博客

12-09

1391

XGBoost参数调优完全指南(附Python代码)译注：文内提供的代码和运行结果有一定差异，可以从这里完整代码对照参考。另外，我自己跟着教程做的时候，发现我的库无法解析字符串类型的特征，所以只用其中一部分特征做的，具体数值跟文章中不一样，反而可以帮助理解文章。所以大家其实也可以小小修改一下代码，不一定要完全跟着教程做~ ^0^需要提前安装好的库：简介如果你的预测模型表现得有些不尽如人意，那就用X...

参与评论您还未登录，请先登录后发表或查看评论

分类数据的创建及排序

Ilovechase的博客

06-27

269

Task03：分类数据分类数据类型在以下情况下非常有用：一个字符串变量，只包含几个不同的值。将这样的字符串变量转换为分类变量将会节省一些内存。变量的词汇顺序与逻辑顺序(“one”，“two”，“three”)不同。通过转换为分类并指定类别上的顺序，排序和最小/最大将使用逻辑顺序，而不是词法顺序。作为其他python库的一个信号，这个列应该被当作一个分类变量(例如，使用合适的统计方法或plot类型)。分类数据Task03：分类数据⼀、category的创建及其性质1. 类变量的创建1.1.1.⽤

Python Seaborn (5) 分类数据的绘制

数据猿

02-14

1597

作者：未禾数据猿官网 | www.datayuan.cn今日头条丨一点资讯丨腾讯丨搜狐丨网易丨凤凰丨阿里UC大鱼丨新浪微博丨新浪看点丨百度百家丨博客中国丨趣头条丨腾讯云·...

分类模型

kingsure001的博客

01-21

972

线性概率模型数据预处理：生成虚拟变量对于因变量为分类变量的情况，我们可以使用逻辑回归进行处理。把y看成事件发生的概率，y>0.5表示发生；y<0.5表示不发生 Spss求解逻辑回归预测成功率假如自变量有分类变量怎么办? 直接点击分类，然后定义分类协变量，Spss会自动帮我们生成预测结果较差怎么办？加入了平方项后,可能会过拟合如何确定合适的模型？把数据分为训练组和测试组，用训练组的数据来估计出模型，再用测试组的数据来进行测试。（训练组和测试组的比例一般设置为8.

Pandas-分类数据

zhuo_bao的博客

06-27

474

Pandas-分类数据category的创建及其性质分类变量的创建用Series创建对DateFrame指定类型创建利用内置Categorical类型创建利用cut函数创建分类变量的结构descibe方法categories和ordered属性类别的修改利用set_categories修改利用rename_categories修改利用add_categories添加利用remove_categories移除分类变量的排序序的建立排序分类变量的比较操作与标量或等长序列的比较与另一分类变量的比较 categor

数据预处理——分类变量处理.rar

07-31

2. **序数编码（Ordinal Encoding）**：如果分类变量具有自然顺序，如“低”、“中”、“高”，可以将它们转化为连续的整数。但这种方法需谨慎，因为顺序可能被模型误解为数值的大小关系。 3. **目标编码（Target ...

分类型变量预测连续型变量_SPSS中的Variable数据变量类型介绍，一次性弄清无序分类变量、有序分类变量、离散型数值变量、连续型数值变量的区别！...

weixin_39605463的博客

11-21

5450

变量的概念：变量也就是就是一种可以进行测量的数据条目(data item)，对于定义变量在统计里非常重要，特别是在进行SPSS分析的时候，需要明确定义一个变量的性质。打开SPSS软件时，数据录入界面上面就显示的全部是变量，如图部分就是变量:1.变量的分类有些变量是一些数值，可以计算或者测量出来，这些变量是量化的定量变量(或数值变量，quantitative or numeric var...

数据预处理：分类和顺序变量转化为数值型数据

sinat_41928169的博客

05-21

3590

分类数据和顺序数据要参与模型计算，通常都会转化为数值型数据。当然，某些算法是允许这些数据直接参与计算的，例如决策树、关联规则等。真值转换要将非数值型数据转换为数值型数据的最佳方法是：将所有分类或顺序变量的值域从一列多值的形态转换为多列只包含真值的形态，其中的真值可通过True、False或0、1的方式来表示。这种标志转换的方法有时候也称为真值转换。代码如下： import pandas as pd # 导入pandas库 from sklearn.preprocessing import

统计学_第一章_统计和数据

程序一笑

01-15

4810

一、统计的含义（一）什么是统计学定义：统计学是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。（二）统计分析数据的方法可分为描述统计和推断统计，两大类。 1、推断统计是研究如何通过样本数据推断总体特征的统计学方法，内容包括参数估计和假设性检验。 2、描述统计是研究数据搜集、处理和描述的统计学方法。内容包括如何获取研究所需要的数据，如何用图表形式对数据进行处理和展示，如何通过对数据的综合、概括与更新，得出所关心的数据特征。（三）统计的应用统计是适用于所有学科领域的通用数据分析方法

logistic回归分析优点_SPSS教程｜二分类logistic回归及SPSS操作

weixin_39785524的博客

11-20

2601

一．案例案例来源：中华护理杂志2018年10期关于轻度认知障碍(MCI)老年人精神行为症状及影响因素的调查研究。方法：采用神经精神问卷(NPI-Q)知情者版，对60名社区初筛为MCI老年人的家属进行调查，根据回收到的有效数据分析MCI老年人精神行为症状的发生情况并研究其影响因素，以期为今后对MCI精神行为症状的预防和干预提供依据。二．说明看过的朋友应该记得，我们之前讲过这个案例，当时是以患者精神行...

处理数据中分类变量的三种方法（附代码实现）

Qlz的博客

02-06

8508

本文是将kaggle Courses中 Categorical Variables | Kaggle进行了翻译并且加入自己的理解，如有地方不清楚，可以查阅原文文章目录介绍三种方法1）删除分类变量2）Ordinal Encoding （序数编码）3）One-Hot Encoding代码实现Drop columns with categorical dataOrdinal encodingOne-hot encoding 介绍一个分类变量只能取到有限变量的值考虑一项调查，询问您吃早餐的频率并提供四个.

python中利用OneHotEncoder进行分类变量和顺序变量的标志转换

huangguohui_123的博客

04-13

3546

数据建模的过程中，很多算法无法直接处理非数值型的变量。非数值变量主要分为分类变量和顺序变量。一、分类变量和顺序变量分类变量：(性别：男、女)(颜色：红、黄、绿.) 顺序数据：(学历：博士、研究生、学士)(用户价值：高、中、低) 二、运用标志方法处理分类和顺序变量将所有分类或顺序变量的值域从一列多值的形态转换为多列只包含真值的形态，称为标示法，如下图：【讨论】为何不能直接...

分类变量、有序变量与数值变量相关性分析方法总结及 R 语言应用

热门推荐

weixin_39982225的博客

03-15

8万+

修改箱线图的横坐标顺序

xndkwj的博客

03-09

8953

library(ggplot2) #首先查看分组名字的levels ggplot(mpg, aes(class, hwy)) + geom_boxplot() #第一种使用，有低到高reorder ggplot(mpg, aes(reorder(class, hwy), hwy)) + geom_boxplot() #按照自己的想法顺序，画图。思路：重新添加一个子集，levels的顺序是我们想要的顺序 mpg$class1 <- factor(mpg$class,levels = c("compact

R语言：分类变量绘图中的排序问题

missinghead的博客

04-01

2085

使用r自带的数据集mpg，绘制了箱线图（boxplot）用来描述不同汽车类别（class）可以行驶的公里数（hwy）的分布。 ggplot(data=mpg,mapping=aes(x=class,y=hwy))+ geom_boxplot() 这个箱式图高低不平的看上去很不协调，如果想重新排一下序如何处理？ reorder(x, X, FUN = mean, ...,order = is.ordered(x)) x : 需要排序的分类变量。 X : 依照这个变量进行排序。 FU.

分类变量

weixin_47728930的博客

06-27

3393

一、分类变量category的创建及其性质 1、分类变量的创建 (a)用Series创建 pd.Series(["a", "b", "c", "a"], dtype="category") （b）对DataFrame指定类型创建（c）利用内置categorical类型创建 cat = pd.Categorical(["a", "b", "c", "a"], categories=['a','b','c']) pd.Series(cat) （d）利用cut函数创建 pd.cut(np.random.ra

特征锦囊：怎么定义一个方法去填充分类变量的空值？

Pysamlam的博客

01-02

672

预计阅读时间：3分钟今日锦囊怎么定义一个方法去填充分类变量的空值？之前我们说过如何删除掉缺失的行，但是如何我们需要的是填充呢？比如说用众数来填充缺失，或者用某个特定值来填充缺失值？这个也...

【MATLAB】工作区变量

你今天真好看呀

08-15

9074

工作区变量工作区包含在 MATLAB® 中创建或从数据文件或其他程序导入的变量。例如，下列语句在工作区中创建变量 A 和 B。 A = magic(4); B = rand(3,5,2); 使用 whos 可以查看工作区的内容。 >> whos Name Size Bytes Class Attributes A ...

spss分类变量编码