3.python数据结构-集合（set）

最新推荐文章于 2023-02-18 13:47:51 发布

wjc920

最新推荐文章于 2023-02-18 13:47:51 发布

阅读量140

点赞数

分类专栏： python基础文章标签： python

本文链接：https://blog.csdn.net/superbrief2200/article/details/79659366

版权

python基础专栏收录该内容

20 篇文章 0 订阅

订阅专栏

# 集合（set）
# 无序、不重复、可放不同类型元素

# 创建非空集合，用{元素序列}
a_set = {1, 2, 'a', 'a', 2}
print('create a non-empty set:')
print(a_set)

# 创建空集合不能用{},{}为空dict
a_set = set()
print('create a empty set:')
print(a_set)

# 初始化两个句子
str_1 = 'dogs chase cats'
str_2 = 'dogs hate cats'

# 统计句子中不重复单词的集合
str_1_words = set(str_1.split())
str_2_words = set(str_2.split())

# 集合不支持索引和切片
try:
    str_1_words[1]
except:
    print("Don't support index")  # Don't support index
try:
    str_1_words[1:]
except:
    print("Don't support slice")  # Don't support slice

# 计算两个句子中不重复单词的个数
len_str_1_words = len(str_1_words)
len_str_2_words = len(str_2_words)
print(len_str_1_words, len_str_2_words)  # output:3 3

# 计算两个set的交集
print(str_1_words.intersection(str_2_words))  # output:{'dogs', 'cats'}
print(str_1_words & str_2_words)  # output:{'dogs', 'cats'}

# 计算两个set的并集
print(str_1_words.union(str_2_words))  # output:{'hate', 'dogs', 'chase', 'cats'}
print(str_1_words | str_2_words)  # output:{'hate', 'dogs', 'chase', 'cats'}

# 计算差集
print(str_1_words.difference(str_2_words))  # output:{'chase'}
print(str_1_words - str_2_words)  # output:{'chase'}

# 计算异或关系
print(str_1_words.symmetric_difference(str_2_words))  # output:{'hate', 'chase'}
print(str_1_words ^ str_2_words)  # output:{'hate', 'chase'}

# # 集合的用法（与sklearn结合）
# union_set = str_1_words.union(str_2_words)
# a = [1 if w in str_1_words else 0 for w in union_set]
# b = [1 if w in str_2_words else 0 for w in union_set]
#
# print(a) # output:[0, 1, 1, 1]
# print(b) # output:[1, 1, 0, 1]
#
# print(jaccard_similarity_score(a,b))

wjc920

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
3.python数据结构-集合（set）

# 集合（set）# 无序、不重复、可放不同类型元素# 创建非空集合，用{元素序列}a_set = {1, 2, 'a', 'a', 2}print('create a non-empty set:')print(a_set)# 创建空集合不能用{},{}为空dicta_set = set()print('create a empty set:')print(a_set)...
复制链接

扫一扫