集合与字典

一、集合
集合(set)是一个无序的不重复元素序列。1,2,3,4,1,2,3 = 1,2,3,4
创建:
1). 使用大括号 { } 或者 set() 函数创建集合;
2). 注意:创建一个空集合必须用 set() 而不是 { }
{ } 是用来创建一个空字典。

看看是否都可以成功定义集合?
s1 = {}
s2 = {1,2,3}
s3 = {1,2,3,‘hello’,(1,2,3),[1,2,3]} 不能成功定义,因为列表可变
basket = {‘apple’, ‘orange’, ‘apple’, ‘pear’, ‘orange’, ‘banana’}
s4 = set(‘abracadabra’)
集合内置方法
在这里插入图片描述

我们也可以用数学方法实现集合的运算
集合set1和set2的交集表示:set1 & set2
集合set1和set2的并集表示:set1 | set2
集合set1和set2的差集表示:set1 - set2(相当于自己减交集)
集合set1和set2的对等差分表示:set1 ^ set2(相当于并集-交集)

子集/父集
“”"
s1 = {1, 2, 3}
s2 = {1,2 }
s1.issuperset(s2) # s1里面包含s2吗?
Out[4]: True
s3 = {1, 4}
s1.issuperset(s3) # s1里面包含s3吗?
Out[6]: False
s2.issubset(s1) # s2包含在s1里面吗?
Out[7]: True
“”"
集合应用案例
1.列表去重:
先转换为集合,在转换回列表
在这里插入图片描述
2. 明明的随机数
明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性,他先用计算机生成了N个1到1000之间的随机整数(N≤1000),对于其中重复的数字,只保留一个,把其余相同的数去掉,不同的数对应着不同的学生的学号。然后再把这些数从大到小排序,按照排好的顺序去找同学做调查。请你协助明明完成“去重”与“排序”的工作(同一个测试用例里可能会有多组数据,希望大家能正确处理)

import  random
N = int(input("生成数:"))
#). 生成了N个1到1000之间的随机整数(N≤1000), 其余相同的数去掉
 创建一个集合, 默认会去重
allNum = set()

#循环N次
for count in range(N):
    # 随机生成一个1-1000之间的随机数;
    num = random.randint(1, 1000)
    allNum.add(num)
print("生成的数据:", allNum)
 **). 然后再把这些数从大到小排序
 集合没有排序的方法, 列表有排序的方法
allNum = list(allNum)
print("正在排序.....")
 由大到小进行排序;
allNum.sort(reverse=True)
print("排序结果:", allNum)

二、字典
字典是另一种可变容器模型,且可存储任意类型对象。
键一般是唯一的,如果重复最后的一个键值对会替换前面的,值不需要唯一
d = {key1 : value1, key2 : value2 }
d = {‘Z’ : ‘字’, ‘D’ : ‘典’ }
字典创建与删除
1). 简单字典创建
索引要拿key
在这里插入图片描述
2). 内建方法:fromkeys
字典中的key有相同的value值,默认为None
在这里插入图片描述
3). zip间接创建
在这里插入图片描述

字典内建方法
在这里插入图片描述
字典应用案例
英文文本预处理:词频统计
作为字典(key-value)的经典应用题目,单词统计几乎出现在每一种语言键值对学习后的必练题目,主要需求:
写一个函数wordcount统计一篇文章的每个单词出现的次数(词频统计)。统计完成后,对该统计按单词频次进行排序。

在这里插入图片描述
方法一*********

def wordcount(str):
    # 文章字符串前期处理
    strl_ist = str.replace('\n', '').lower().split(' ')
    count_dict = {}
    # 如果字典里有该单词则加1,否则添加入字典
    for str in strl_ist:
        if str in count_dict.keys():
            count_dict[str] = count_dict[str] + 1
        else:
            count_dict[str] = 1
    #按照词频从高到低排列
    count_list=sorted(count_dict.iteritems(),key=lambda x:x[1],reverse=True)
    return count_list
print wordcount(str_context)

方法二********

 ********************* 简易方法实现**********************
from collections import  defaultdict
from collections import  Counter


 **************1.统计每个单词出现的次数************
wordDict = defaultdict(int)
for word in li:
    wordDict[word] += 1
print(wordDict.items())

 *******************2. 找出单词出现次数最多的3个单词**********
c = Counter(wordDict)
print(c.most_common(5))

通过字典的方式去重:, 因为字典的key值是不能重复的.

	li = [1, 2, 3, 4, 65, 1, 2, 3]
	print({}.fromkeys(li).keys())

switch语句实现
在python里是没有seitch方法的,如何间接实现?
在C中:
在这里插入图片描述
python实现:
在这里插入图片描述

一键多值字典:defaultdict

collections.defaultdict类,本身提供了默认值的功能, 默认值可以是整形,列表,集合等.

需求:
我们想要一个能将键(key)映射到多个值的字(即所谓的一键多值字典)

解决方案:
1). 字典是一种关联容器,每个键都映射到一个单独的值上。如果想让键映射到多个值,需要将这些多个值保存到容器(列表或者集合)中。
2). 利用collections模块中的defaultdict类自动初始化第一个值,这样只需关注添加元素.

在这里插入图片描述
在这里插入图片描述
内置数据结构总结

可变数据类型:可以增删改。可变数据类型,允许变量的值发生变化,即如果对变量进行append、+=等这种操作后,只是改变了变量的值,而不会新建一个对象,变量引用的对象的地址也不会变化,不过对于相同的值的不同对象,在内存中则会存在不同的对象,即每个对象都有自己的地址,相当于内存中对于同值的对象保存了多份,这里不存在引用计数,是实实在在的对象。
不可变数据类型:不可以增删改。python中的不可变数据类型,不允许变量的值发生变化,如果改变了变量的值,相当于是新建了一个对象,而对于相同的值的对象,在内存中则只有一个对象,内部会有一个引用计数来记录有多少个变量引用这个对象。

Python内置函数以及内置字典与集合的用法
推荐算法
推荐资料: http://www.voidcn.com/article/p-yayskzin-zt.html

三、练习
1. 有一个列表,其中包括 10 个元素,例如这个列表是[1,2,3,4,5,6,7,8,9,0],要求将列表中的每个元素一次向前移动一个位置,第一个元素到列表的最后,然后输出这个列表。最终样式是[2,3,4,5,6,7,8,9,0,1]
代码:

lis = [1, 2, 3, 4, 5, 6, 7, 8, 9, 0]
num = lis.pop(0)
lis.append(num)
print(lis)

运行截图
在这里插入图片描述

2.按照下面的要求实现对列表的操作:
1). 产生一个列表,其中有 40 个元素,每个元素是 50 到 100 的一个随机整数
2). 如果这个列表中的数据代表着某个班级 40 人的分数,请计算成绩低于平均分的学生人数
3). 对上面的列表元素从大到小排序并输出li.sort(reverse=True)

代码:

from collections import Counter
import random
lis =[]
for it in range(40):
    num = random.randint(50,100)
    lis.append(num)
#print(lis)
num = 0
average_score = sum(lis)/40
for it in lis:
    if it <average_score:
        num+=1

sort_lis = sorted(lis,reverse=True)
print('小于平均分的人数有:',num)
print('排序后的列表为:',sort_lis)

运行截图:
在这里插入图片描述
3.问题描述:
如果将一句话作为一个字符串,那么这个字符串中必然会有空格(这里仅讨论英文),比如"How are you.",但有的时候,会在两个单词之间多大一个空格。现在的任务是,如果一个字符串中有连续的两个空格,请把它删除。

代码:

str = 'One day he   asked an   artist to draw him a beautiful  horse    '
print(str)
oldstr = str.split()
print(oldstr)
newstr = ' '.join(oldstr)
print(newstr)
先按默认分割,再拿空格符拼接

在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值