一、集合
集合(set)是一个无序的不重复元素序列。
1.集合的创建:
1). 使用大括号 { } 或者 set() 函数创建集合;
2). 注意:
1创建一个空集合必须用 set() 而不是 { }
{ } 是用来创建一个空字典。
2 集合的元素必须是不可变数据类型。
2.集合的特性
- 不支持+,*, index, slice(因为集合无序不重复的)
- 支持成员操作符in和not in
3. 集合的常用操作
1)增加
2)删除
4)查看
issubset:s1是否为s2子集
isdisjoint:两集合是否包含相同元素(有–>false,没有–>true)
4.拓展(frozenset)
frozenset 是 set 的不可变版本,因此 set 集合中所有能改变集合本身的方法(如 add、remove、discard、xxx_update 等),frozenset 都不支持;set 集合中不改变集合本身的方法,fronzenset 都支持。
- 当集合元素不需要改变时,使用 frozenset 代替 set 更安全。
- 当某些 API 需要不可变对象时,必须用 frozenset 代替set。比如 dict 的 key 必须是不可变对象,因此只能用 frozenset;再比如 set 本身的集合元素必须是不可变的,因此 set 不能包含 set,set 只能包含 frozenset。
5.集合例题
random.randint(1, 1000)
li.sort() 排序
import random
n = int(input("输入n:"))
s=set()
for i in range(n):
s.add(random.randint(1,1000))
print(sorted(s,reverse=True))
二、字典
字典是另一种可变容器模型,且可存储任意类型对象。
键一般是唯一的,如果重复最后的一个键值对会替换前面的,值不需要唯一。
d = {key1 : value1, key2 : value2 }
d = {‘Z’ : ‘字’, ‘D’ : ‘典’ }
1. 字典的创建dict
#key-value对或者键值对
d = {“name”:“lyx”, “age”:20, “city”:“西安”}
print(d, type(d))
d = {}
print(d, type(d))
2. 字典的特性
- 不支持+,*, index, slice(因为集合无序不重复的)
- 支持in和not in
d = {"name":"westos", "age":18, "city":"西安"}
print('name' in d) # True, 判断是否为所有key值得成员
print("westos" in d) # False
3. 字典的常用方法
3-1). 查看
“”"
查看所有: keys, values, items
查看局部: d[key], d.get(key), d.get(key, default-value)
“”"
d = {“name”:“westos”, “age”:18, “city”:“西安”}
print(d.keys()) # 查看字典所有的key值
print(d.values()) # 查看字典所有的value值
print(d.items()) # 查看字典所有的key-value值(item元素)
print(d[‘name’]) # 查看key为name对应的value值
print(d[‘province’]) # 查看key对应的vlaue值,如果不存在会报错。
print(d.get(‘province’)) # 查看key对应的vlaue值, 如果存在则返回,如果不在在则返回None.
print(d.get(‘province’, “陕西”)) # 查看key对应的vlaue值, 如果存在则返回,如果不在在则返回默认值.
3-2). 增加和修改
d = {“name”:“westos”, “age”:18}
d[‘city’] = “西安” # key不存在就添加
print(d)
d[‘city’] = “北京” # key存在则修改value值
print(d)
d = {“name”:“westos”, “age”:18}
d.setdefault(‘city’, “西安”) # key不存在就添加
print(d)
d.setdefault(‘city’, “北京”) # key存在,则do nothing
print(d)
3-3). 删除
d = {“name”:“westos”, “age”:18}
d.pop(‘name’)
print(d)
d = {“name”:“westos”, “age”:18}
del d[‘name’]
print(d)
4. 遍历字典(for)
>d = {"name":"westos", "age":18, "city":"西安"}
#默认情况下,字典只会遍历key值
for item in d:
print(item)
#如果遍历字典的key和value呢?(特别特别重要)
for key,value in d.items(): # [('name', 'westos'), ('age', 18), ('city', '西安')]
print(f"key={key}, value={value}")
5.拓展(defaultdict)
- collections.defaultdict类,本身提供了默认值的功能, 默认值可以是整形,列表,集合等.
defaultdict 是 dict 的子类。但它与 dict 最大的区别在于,如果程序试图根据不存在的 key 访问
value,会引发 KeyError 异常;而 defaultdict 提供default_factory 属性,该为不存在的 key 来
自动生成生成默认的 value
- 解决方案:
1). 字典是一种关联容器,每个键都映射到一个单独的值上。如果想让键映射到多个值,需要将这些多个值保存到容器(列表或者集合)中。
2). 利用collections模块中的defaultdict类自动初始化第一个值,这样只需关注添加元素.
from collections import defaultdict
“默认字典,设置默认value”
d = defaultdict(int)
d[‘views’] += 1
d[‘transfer’] += 1
print(d)
d = defaultdict(list)
d[‘allow_users’].append(‘westos’)
d[‘deny_users’].extend([‘user1’, ‘user2’])
print(d)
d = defaultdict(set)
d[‘love_movies’].add(“黑客帝国”)
d[‘like_movies’].update({‘唐探3’, ‘你好,李焕英’})
print(d)
6.练习题
"""
技能需求:
1.文件操作
2.字符串的分割操作
3.字典操作
功能需求:词频统计
1.读取文件song.txt with open(song.txt) as f : content = f.read()
2.加载分析文件中的每一个单词,统计每个单词出现的次数,使用split分割
#先设定空字典{},统计次数一个一个往进加
song.txt文件内容
hello python
hello java
hello golong
hello sql
hello php
hello perl
hello ruby
hello k8s
k8s is good
k8s is best
"""
#方法一:
word = {}
with open('doc/song.txt') as f:
content = f.read()
song = content.split(' ' or '\n')
print(song)
for item in song:
if item not in word:
word[item]=1
else:
word[item]+=1
print(word)
#方法二
with open('doc/song.txt') as f:
content = f.read().split()
#2.统计
result ={}
for word in content:
if word in result:
result[word] +=1
else:
result[word] =1
##自动换行小技巧,友好打印信息
import pprint
pprint.pprint(result)
#方法三(小技巧)
#1. 加载文件中所有单词
with open('doc/song.txt') as f:
content = f.read().split()
#2.统计
from collections import Counter
counter = Counter(content) ##统计个数Counter({'hello': 8, 'k8s': 3, 'is': 2, 'python': 1, 'java': 1, 'golong': 1, 'sql': 1, 'php': 1, 'perl': 1, 'ruby': 1, 'good': 1, 'best': 1})
print(counter)
result = counter.most_common(5) ##统计出现次数最多的5个单词[('hello', 8), ('k8s', 3), ('is', 2), ('python', 1), ('java', 1)]
print(result)
三、内置数据结构总结
可变数据类型:可以增删改。可变数据类型,允许变量的值发生变化,(即如果对变量进行append、+=等这种操作后,只是改变了变量的值,而不会新建一个对象,变量引用的对象的地址也不会变化),不过对于相同的值的不同对象,在内存中则会存在不同的对象,(即每个对象都有自己的地址,相当于内存中对于同值的对象保存了多份,这里不存在引用计数,是实实在在的对象)。
不可变数据类型:不可以增删改。python中的不可变数据类型,不允许变量的值发生变化,如果改变了变量的值,相当于是新建了一个对象,而对于相同的值的对象,在内存中则只有一个对象,内部会有一个引用计数来记录有多少个变量引用这个对象。
序列与非序列:
可变与不可变:
——可变数据类型: list, set, dict
——不可变数据类型: 数值类型,tuple, str
- get