Python中的集合与字典

最新推荐文章于 2023-06-18 14:10:04 发布

阳止甘十

最新推荐文章于 2023-06-18 14:10:04 发布

阅读量1k

点赞数

分类专栏： Python 文章标签：列表 python 运维

本文链接：https://blog.csdn.net/qq_49286390/article/details/114122488

版权

Python 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

一、集合

集合（set）是一个无序的不重复元素序列。

1.集合的创建:

1). 使用大括号 { } 或者 set() 函数创建集合;

2). 注意：
1创建一个空集合必须用 set() 而不是 { }
{ } 是用来创建一个空字典。

2 集合的元素必须是不可变数据类型。

2.集合的特性

不支持+,*, index, slice(因为集合无序不重复的)
支持成员操作符in和not in

3. 集合的常用操作

在这里插入图片描述

1)增加

在这里插入图片描述

2)删除

在这里插入图片描述

4)查看

issubset：s1是否为s2子集
isdisjoint：两集合是否包含相同元素（有–>false，没有–>true）
在这里插入图片描述

4.拓展（frozenset）

frozenset 是 set 的不可变版本，因此 set 集合中所有能改变集合本身的方法（如 add、remove、discard、xxx_update 等），frozenset 都不支持；set 集合中不改变集合本身的方法，fronzenset 都支持。
在这里插入图片描述

当集合元素不需要改变时，使用 frozenset 代替 set 更安全。
当某些 API 需要不可变对象时，必须用 frozenset 代替set。比如 dict 的 key 必须是不可变对象，因此只能用 frozenset；再比如 set 本身的集合元素必须是不可变的，因此 set 不能包含 set，set 只能包含 frozenset。

5.集合例题

random.randint(1, 1000)
li.sort() 排序

import random
n = int(input("输入n:"))
s=set()
for i in range(n):
  s.add(random.randint(1,1000))
print(sorted(s,reverse=True))

在这里插入图片描述

二、字典

字典是另一种可变容器模型，且可存储任意类型对象。
键一般是唯一的，如果重复最后的一个键值对会替换前面的，值不需要唯一。
d = {key1 : value1, key2 : value2 }
d = {‘Z’ : ‘字’, ‘D’ : ‘典’ }

1. 字典的创建dict

#key-value对或者键值对
d = {“name”:“lyx”, “age”:20, “city”:“西安”}
print(d, type(d))
d = {}
print(d, type(d))

2. 字典的特性

不支持+,*, index, slice(因为集合无序不重复的)
支持in和not in

d = {"name":"westos", "age":18, "city":"西安"}
print('name' in d)  # True， 判断是否为所有key值得成员
print("westos" in d) # False

3. 字典的常用方法

在这里插入图片描述

3-1). 查看

“”"
查看所有: keys, values, items
查看局部: d[key], d.get(key), d.get(key, default-value)
“”"
d = {“name”:“westos”, “age”:18, “city”:“西安”}
print(d.keys()) # 查看字典所有的key值
print(d.values()) # 查看字典所有的value值
print(d.items()) # 查看字典所有的key-value值(item元素)
print(d[‘name’]) # 查看key为name对应的value值
print(d[‘province’]) # 查看key对应的vlaue值，如果不存在会报错。
print(d.get(‘province’)) # 查看key对应的vlaue值，如果存在则返回，如果不在在则返回None.
print(d.get(‘province’, “陕西”)) # 查看key对应的vlaue值，如果存在则返回，如果不在在则返回默认值.

3-2). 增加和修改

d = {“name”:“westos”, “age”:18}
d[‘city’] = “西安” # key不存在就添加
print(d)
d[‘city’] = “北京” # key存在则修改value值
print(d)
d = {“name”:“westos”, “age”:18}
d.setdefault(‘city’, “西安”) # key不存在就添加
print(d)
d.setdefault(‘city’, “北京”) # key存在，则do nothing
print(d)

3-3). 删除

d = {“name”:“westos”, “age”:18}
d.pop(‘name’)
print(d)
d = {“name”:“westos”, “age”:18}
del d[‘name’]
print(d)

4. 遍历字典(for)

>d = {"name":"westos", "age":18, "city":"西安"}
 #默认情况下，字典只会遍历key值
for item in d:
    print(item)
 #如果遍历字典的key和value呢?(特别特别重要)
for key,value in d.items():  # [('name', 'westos'), ('age', 18), ('city', '西安')]
    print(f"key={key}, value={value}")

在这里插入图片描述

5.拓展（defaultdict）

- collections.defaultdict类，本身提供了默认值的功能， 默认值可以是整形，列表，集合等.

	defaultdict 是 dict 的子类。但它与 dict 最大的区别在于，如果程序试图根据不存在的 key 访问
  value，会引发 KeyError 异常；而 defaultdict 提供default_factory 属性，该为不存在的 key 来
  自动生成生成默认的 value

- 解决方案：
	1). 字典是一种关联容器，每个键都映射到一个单独的值上。如果想让键映射到多个值，需要将这些多个值保存到容器（列表或者集合）中。
	2). 利用collections模块中的defaultdict类自动初始化第一个值，这样只需关注添加元素.

from collections import defaultdict
“默认字典，设置默认value”
d = defaultdict(int)
d[‘views’] += 1
d[‘transfer’] += 1
print(d)
d = defaultdict(list)
d[‘allow_users’].append(‘westos’)
d[‘deny_users’].extend([‘user1’, ‘user2’])
print(d)
d = defaultdict(set)
d[‘love_movies’].add(“黑客帝国”)
d[‘like_movies’].update({‘唐探3’, ‘你好，李焕英’})
print(d)

6.练习题

"""
技能需求:
    1.文件操作
    2.字符串的分割操作
    3.字典操作
功能需求:词频统计
    1.读取文件song.txt with open(song.txt) as f : content = f.read()
    2.加载分析文件中的每一个单词,统计每个单词出现的次数,使用split分割
    #先设定空字典{}，统计次数一个一个往进加
song.txt文件内容
	hello python
	hello java
	hello golong
	hello sql
	hello php
	hello perl
	hello ruby
	hello k8s
	k8s is good
	k8s is best
"""
#方法一:
word = {}
with open('doc/song.txt') as f:
    content = f.read()
    song = content.split(' ' or '\n')
    print(song)
    for item in song:
        if item not in word:
            word[item]=1
        else:
            word[item]+=1
    print(word)
#方法二
with open('doc/song.txt') as f:
    content = f.read().split()
#2.统计
result ={}
for word in content:
    if word in result:
        result[word] +=1
    else:
        result[word] =1

##自动换行小技巧，友好打印信息
import  pprint
pprint.pprint(result)

#方法三(小技巧)

#1. 加载文件中所有单词
with open('doc/song.txt') as f:
    content = f.read().split()
#2.统计
from collections import  Counter
counter = Counter(content)         ##统计个数Counter({'hello': 8, 'k8s': 3, 'is': 2, 'python': 1, 'java': 1, 'golong': 1, 'sql': 1, 'php': 1, 'perl': 1, 'ruby': 1, 'good': 1, 'best': 1})
print(counter)
result = counter.most_common(5)    ##统计出现次数最多的5个单词[('hello', 8), ('k8s', 3), ('is', 2), ('python', 1), ('java', 1)]
print(result)

三、内置数据结构总结

可变数据类型：可以增删改。可变数据类型，允许变量的值发生变化，(即如果对变量进行append、+=等这种操作后，只是改变了变量的值，而不会新建一个对象，变量引用的对象的地址也不会变化)，不过对于相同的值的不同对象，在内存中则会存在不同的对象，(即每个对象都有自己的地址，相当于内存中对于同值的对象保存了多份，这里不存在引用计数，是实实在在的对象)。
不可变数据类型：不可以增删改。python中的不可变数据类型，不允许变量的值发生变化，如果改变了变量的值，相当于是新建了一个对象，而对于相同的值的对象，在内存中则只有一个对象，内部会有一个引用计数来记录有多少个变量引用这个对象。
序列与非序列：

可变与不可变：
——可变数据类型: list, set, dict
——不可变数据类型: 数值类型，tuple, str

Leecode算法题：
两数之和
 无重复的最长子串

阳止甘十

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Python中的集合与字典

一、集合集合（set）是一个无序的不重复元素序列。1.集合的创建:1). 使用大括号 { } 或者 set() 函数创建集合;2). 注意：1创建一个空集合必须用 set() 而不是 { }{ } 是用来创建一个空字典。2 集合的元素必须是不可变数据类型。2.集合的特性不支持+,*, index, slice(因为集合无序不重复的)支持成员操作符in和not in3. 集合的常用操作...
复制链接

扫一扫