集合与字典

最新推荐文章于 2022-11-05 15:48:42 发布

妖x月

最新推荐文章于 2022-11-05 15:48:42 发布

阅读量326

点赞数

本文链接：https://blog.csdn.net/qq_42349627/article/details/90384243

版权

一、集合
集合（set）是一个无序的不重复元素序列。1,2,3,4,1,2,3 = 1,2,3,4
创建:
1). 使用大括号 { } 或者 set() 函数创建集合;
2). 注意：创建一个空集合必须用 set() 而不是 { }
{ } 是用来创建一个空字典。

看看是否都可以成功定义集合？
s1 = {}
s2 = {1,2,3}
s3 = {1,2,3,‘hello’,(1,2,3),[1,2,3]} 不能成功定义,因为列表可变
basket = {‘apple’, ‘orange’, ‘apple’, ‘pear’, ‘orange’, ‘banana’}
s4 = set(‘abracadabra’)
集合内置方法
在这里插入图片描述

我们也可以用数学方法实现集合的运算
集合set1和set2的交集表示：set1 & set2
集合set1和set2的并集表示：set1 | set2
集合set1和set2的差集表示：set1 - set2(相当于自己减交集)
集合set1和set2的对等差分表示：set1 ^ set2(相当于并集-交集)

子集/父集
“”"
s1 = {1, 2, 3}
s2 = {1,2 }
s1.issuperset(s2) # s1里面包含s2吗?
Out[4]: True
s3 = {1, 4}
s1.issuperset(s3) # s1里面包含s3吗?
Out[6]: False
s2.issubset(s1) # s2包含在s1里面吗?
Out[7]: True
“”"
集合应用案例
1.列表去重：
先转换为集合，在转换回列表
在这里插入图片描述
2. 明明的随机数
明明想在学校中请一些同学一起做一项问卷调查，为了实验的客观性，他先用计算机生成了N个1到1000之间的随机整数（N≤1000），对于其中重复的数字，只保留一个，把其余相同的数去掉，不同的数对应着不同的学生的学号。然后再把这些数从大到小排序，按照排好的顺序去找同学做调查。请你协助明明完成“去重”与“排序”的工作(同一个测试用例里可能会有多组数据，希望大家能正确处理)

import  random
N = int(input("生成数:"))
#). 生成了N个1到1000之间的随机整数（N≤1000）, 其余相同的数去掉
 创建一个集合, 默认会去重
allNum = set()

#循环N次
for count in range(N):
    # 随机生成一个1-1000之间的随机数;
    num = random.randint(1, 1000)
    allNum.add(num)
print("生成的数据:", allNum)
 **). 然后再把这些数从大到小排序
 集合没有排序的方法， 列表有排序的方法
allNum = list(allNum)
print("正在排序.....")
 由大到小进行排序;
allNum.sort(reverse=True)
print("排序结果:", allNum)

二、字典
字典是另一种可变容器模型，且可存储任意类型对象。
键一般是唯一的，如果重复最后的一个键值对会替换前面的，值不需要唯一
d = {key1 : value1, key2 : value2 }
d = {‘Z’ : ‘字’, ‘D’ : ‘典’ }
字典创建与删除
1). 简单字典创建
索引要拿key
在这里插入图片描述
2). 内建方法:fromkeys
字典中的key有相同的value值，默认为None

3). zip间接创建

字典内建方法
在这里插入图片描述
字典应用案例
英文文本预处理：词频统计
作为字典(key-value)的经典应用题目，单词统计几乎出现在每一种语言键值对学习后的必练题目，主要需求：
写一个函数wordcount统计一篇文章的每个单词出现的次数(词频统计)。统计完成后，对该统计按单词频次进行排序。

在这里插入图片描述
方法一*********

def wordcount(str):
    # 文章字符串前期处理
    strl_ist = str.replace('\n', '').lower().split(' ')
    count_dict = {}
    # 如果字典里有该单词则加1，否则添加入字典
    for str in strl_ist:
        if str in count_dict.keys():
            count_dict[str] = count_dict[str] + 1
        else:
            count_dict[str] = 1
    #按照词频从高到低排列
    count_list=sorted(count_dict.iteritems(),key=lambda x:x[1],reverse=True)
    return count_list
print wordcount(str_context)

方法二********

 ********************* 简易方法实现**********************
from collections import  defaultdict
from collections import  Counter


 **************1.统计每个单词出现的次数************
wordDict = defaultdict(int)
for word in li:
    wordDict[word] += 1
print(wordDict.items())

 *******************2. 找出单词出现次数最多的3个单词**********
c = Counter(wordDict)
print(c.most_common(5))

通过字典的方式去重:，因为字典的key值是不能重复的.

	li = [1, 2, 3, 4, 65, 1, 2, 3]
	print({}.fromkeys(li).keys())

switch语句实现
在python里是没有seitch方法的，如何间接实现？
在C中：
在这里插入图片描述
python实现：

一键多值字典：defaultdict

collections.defaultdict类，本身提供了默认值的功能，默认值可以是整形，列表，集合等.

需求：
我们想要一个能将键（key）映射到多个值的字（即所谓的一键多值字典）

解决方案：
1). 字典是一种关联容器，每个键都映射到一个单独的值上。如果想让键映射到多个值，需要将这些多个值保存到容器（列表或者集合）中。
2). 利用collections模块中的defaultdict类自动初始化第一个值，这样只需关注添加元素.

在这里插入图片描述

内置数据结构总结

可变数据类型:可以增删改。可变数据类型，允许变量的值发生变化，即如果对变量进行append、+=等这种操作后，只是改变了变量的值，而不会新建一个对象，变量引用的对象的地址也不会变化，不过对于相同的值的不同对象，在内存中则会存在不同的对象，即每个对象都有自己的地址，相当于内存中对于同值的对象保存了多份，这里不存在引用计数，是实实在在的对象。
不可变数据类型:不可以增删改。python中的不可变数据类型，不允许变量的值发生变化，如果改变了变量的值，相当于是新建了一个对象，而对于相同的值的对象，在内存中则只有一个对象，内部会有一个引用计数来记录有多少个变量引用这个对象。

Python内置函数以及内置字典与集合的用法
推荐算法
推荐资料： http://www.voidcn.com/article/p-yayskzin-zt.html

三、练习
1. 有一个列表，其中包括 10 个元素，例如这个列表是[1,2,3,4,5,6,7,8,9,0],要求将列表中的每个元素一次向前移动一个位置，第一个元素到列表的最后，然后输出这个列表。最终样式是[2,3,4,5,6,7,8,9,0,1]
代码：

lis = [1, 2, 3, 4, 5, 6, 7, 8, 9, 0]
num = lis.pop(0)
lis.append(num)
print(lis)

运行截图
在这里插入图片描述

2.按照下面的要求实现对列表的操作：
1). 产生一个列表，其中有 40 个元素，每个元素是 50 到 100 的一个随机整数
2). 如果这个列表中的数据代表着某个班级 40 人的分数，请计算成绩低于平均分的学生人数
3). 对上面的列表元素从大到小排序并输出li.sort(reverse=True)
代码:

from collections import Counter
import random
lis =[]
for it in range(40):
    num = random.randint(50,100)
    lis.append(num)
#print(lis)
num = 0
average_score = sum(lis)/40
for it in lis:
    if it <average_score:
        num+=1

sort_lis = sorted(lis,reverse=True)
print('小于平均分的人数有：',num)
print('排序后的列表为：',sort_lis)

运行截图：
在这里插入图片描述
3.问题描述：
如果将一句话作为一个字符串，那么这个字符串中必然会有空格（这里仅讨论英文），比如"How are you."，但有的时候，会在两个单词之间多大一个空格。现在的任务是，如果一个字符串中有连续的两个空格，请把它删除。
代码：

str = 'One day he   asked an   artist to draw him a beautiful  horse    '
print(str)
oldstr = str.split()
print(oldstr)
newstr = ' '.join(oldstr)
print(newstr)
先按默认分割，再拿空格符拼接

在这里插入图片描述

妖x月

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
集合与字典

一、集合集合（set）是一个无序的不重复元素序列。1,2,3,4,1,2,3 = 1,2,3,4创建: 1). 使用大括号 { } 或者 set() 函数创建集合;2). 注意：创建一个空集合必须用 set() 而不是 { }{ } 是用来创建一个空字典。看看是否都可以成功定义集合？s1 = {}s2 = {1,2,3}s3 = {1,2,3,‘hello’,(1,2,3),[1...
复制链接

扫一扫