[python + debug] set()操作对象的元素为字符串，则结果随机排序，使用sorted()函数以固定顺序

最新推荐文章于 2022-03-25 21:56:28 发布

Harry嗷

最新推荐文章于 2022-03-25 21:56:28 发布

阅读量364

点赞数

分类专栏： BUG解决 Python 文章标签：字符串 python 数据结构机器学习

本文链接：https://blog.csdn.net/qq_41683065/article/details/105037807

版权

Python 同时被 2 个专栏收录

62 篇文章 4 订阅

订阅专栏

BUG解决

27 篇文章 4 订阅

订阅专栏

文章目录

问题描述

当我对数据集的字符串类型的label进行编码时，要使用set()函数来提取出所有类别的标签。

这样做的结果是，我发现每次画出来的图，每次样本点的颜色都不一样。而颜色代表label，即每次编码得到的label都不一样。而这在统计数量的时候会出现麻烦。

比如下面是两次编码的结果：

{'Neural_Networks', 'Reinforcement_Learning', 'Genetic_Algorithms', 'Rule_Learning', 'Probabilistic_Methods', 'Theory', 'Case_Based'}

{'Theory', 'Case_Based', 'Neural_Networks', 'Genetic_Algorithms', 'Reinforcement_Learning', 'Rule_Learning', 'Probabilistic_Methods'}

而label的映射都是0，1，2，……，即每次的标签编码的结果都是随机（不同）的。

原因分析

set()操作对象的元素为字符串，则结果随机排序。

比如下面的demo所示：

list1 = ['a', 'c', 'b', 'e', 'd', 'a', 'e']

labels = set(list1)
print(labels)
# {'e', 'b', 'a', 'c', 'd'}

解决方式

使用sorted()函数对set()函数的返回值进行排序。

需要注意的是，sorted的返回值不再是set类型，而是list类型。

demo如下：

list1 = ['a', 'c', 'b', 'e', 'd', 'a', 'e']

labels = set(list1)
print(labels)
# {'e', 'b', 'a', 'c', 'd'}

labels = sorted(labels)
print(labels)
# ['a', 'b', 'c', 'd', 'e']

Harry嗷

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[python + debug] set()操作对象的元素为字符串，则结果随机排序，使用sorted()函数以固定顺序

文章目录问题描述原因分析解决方式问题描述当我对数据集的字符串类型的label进行编码时，要使用set()函数来提取出所有类别的标签。这样做的结果是，我发现每次画出来的图，每次样本点的颜色都不一样。而颜色代表label，即每次编码得到的label都不一样。而这在统计数量的时候会出现麻烦。比如下面是两次编码的结果：{'Neural_Networks', 'Reinforcement_Lear...
复制链接

扫一扫