Python基础之——6_内置数据结构集合与字典

目录

一、一山不容二虎的集合

二、frozenset

三、字典

字典创建与删除

字典内建方法

四、defaultdict

五、内置数据结构总结

可变与不可变数据类型

有序序列和无序序列

六、实验操作

6.1 集合的操作

6.2 集合的练习

6.3 字典的操作

6.4 字典的拓展defaultdict

6.5 数据类型的汇总


一、一山不容二虎的集合

集合内置方法

集合应用案例: 列表去重

在抓取页面图片时,为避免重复抓取,将抓取的img结果(结果集是list类型的)通过集合去重。

方法一: 依次遍历并判断

 方法二: 通过set方法进行处理

二、frozenset

frozenset 是 set 的不可变版本,因此 set 集合中所有能改变集合本身的方法(如 add、remove、discard、xxx_update 等),frozenset 都不支持;set 集合中不改变集合本身的方法,fronzenset 都支持。

frozenset 的这些方法和 set 集合同名方法的功能完全相同。frozenset 的作用主要有两点:

当集合元素不需要改变时 ,使用 frozenset 代替 set 更安全。
当某些 API 需要不可变对象时 ,必须用 frozenset 代替set。比如 dict 的 key 必须是不可变对象,因此只能用 frozenset;再比如 set 本身的集合元素必须是不可变的,因此 set 不能包含 set,set 只能包含 frozenset。

三、字典

字典是另一种可变容器模型,且可存储任意类型对象。

键一般是唯一的,如果重复最后的一个键值对会替换前面的,值不需要唯一

d = {key1 : value1, key2 : value2 }

d = {'Z' : '', 'D' : '' }

字典创建与删除

1). 简单字典创建

2).    内建方法:fromkeys

  字典中的key有相同的value值,默认为None

3).    zip间接创建

字典内建方法

四、defaultdict

collections.defaultdict类,本身提供了默认值的功能, 默认值可以是整形,列表,集合等.

defaultdictdict 的子类。但它与 dict 最大的区别在于,如果程序试图根据不存在的 key 访问 value,会引发 KeyError 异常;而 defaultdict 提供default_factory 属性,该为不存在的 key 来自动生成生成默认的 value。

 需求:

   我们想要一个能将键(key)映射到多个值的字(即所谓的一键多值字典)

解决方案:

  1). 字典是一种关联容器,每个键都映射到一个单独的值上。如果想让键映射到多个值,需要将这些多个值保存到容器(列表或者集合)中。

  2). 利用collections模块中的defaultdict类自动初始化第一个值,这样只需关注添加元素.

五、内置数据结构总结

可变与不可变数据类型

可变数据类型:可以增删改可变数据类型,允许变量的值发生变化,即如果对变量进行append+=等这种操作后,只是改变了变量的值,而不会新建一个对象,变量引用的对象的地址也不会变化,不过对于相同的值的不同对象,在内存中则会存在不同的对象,即每个对象都有自己的地址,相当于内存中对于同值的对象保存了多份,这里不存在引用计数,是实实在在的对象。

不可变数据类型:不可以增删改python中的不可变数据类型,不允许变量的值发生变化,如果改变了变量的值,相当于是新建了一个对象,而对于相同的值的对象,在内存中则只有一个对象,内部会有一个引用计数来记录有多少个变量引用这个对象。

有序序列和无序序列

有序序列拥有的特性: 索引、切片、连接操作符、重复操作符以及成员操作符等特性。

六、实验操作

6.1 集合的操作

# 1. 集合的创建
s = {1, 2, 3, 1, 2, 3} # {1, 2, 3}
print(s, type(s))
# 注意点1: 集合的元素必须时不可变数据类型。
# s = {1, 2, 3, [1, 2, 3]}
# print(s, type(s))
# 注意点2:空集合不能使用{}, 而要使用set()
# s = {}
# print(s, type(s))
s  = set()
print(s, type(s))

# 2. 集合的特性:
# 不支持+,*, index, slice(因为集合无序不重复的)
# 支持in和not in
print(1 in {1, 2, 3, 4})


# 3. 集合的常用操作
# 3-1). 增加
#       add: 添加单个元素
#       update: 添加多个元素
s = {1, 2, 3}
s.add(100)
print(s)
s = {1, 2, 3}
s.update({4, 5, 6})
print(s)


# 3-2). 删除
#       remove: 如果元素存在,删除,否则报错
#       discard: 如果元素存在,删除,否则do nothing
#       pop: 随机
#       删除元素,集合为空则报错
s = {1, 2, 3}
s.remove(3)
print(s)
s = {1, 2, 3}
s.discard(100)
print(s)
s = {1, 66, 2,99, 78, 3}
s.pop()
print(s)


# 3-3). 查看
#           差集: s1 - s2
#           交集: s1 & s2
#           对称差分: s1 ^ s2
#           并集: s1 | s2
s1 = {1, 2, 3}
s2 = {1, 2}
print(s1 - s2)  # {3}
print(s1 & s2)  # {1, 2}
s1 = {1, 2, 3}
s2 = {1, 2, 4}
print(s1 ^ s2)  # {3, 4}, {1, 2, 3, 4} - {1, 2} = {3,4}
print(s1 | s2)  # {1, 2, 3, 4}
print(s1.issubset(s2))  # False
print(s1.isdisjoint(s2)) # False


# 4. 拓展: frozenset不可变的集合
s = frozenset({1, 2, 3})
print(s, type(s))

6.2 集合的练习

'''
明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性,
他先用计算机生成了N个1到1000之间的随机整数(N≤1000),对于其中重复的数字,
只保留一个,把其余相同的数去掉,不同的数对应着不同的学生的学号。
然后再把这些数从大到小排序,按照排好的顺序去找同学做调查。
请你协助明明完成“去重”与“排序”的工作(同一个测试用例里可能会有多组数据,希望大家能正确处理)。
'''

import random

n = int(input("输入n:"))
s = set()
for i in range(n):
    s.add(random.randint(1, 1000))
print(sorted(s, reverse=True))

6.3 字典的操作

# 1. 字典的创建dict
# key-value对或者键值对
d = {"name":"westos", "age":18, "city":"西安"}
print(d, type(d))
d = {}
print(d, type(d))

# 2. 字典的特性
# 不支持+,*, index, slice(因为集合无序不重复的)
# 支持in和not in
d = {"name":"westos", "age":18, "city":"西安"}
print('name' in d)  # True, 判断是否为所有key值得成员
print("westos" in d) # False

# 3. 字典的常用方法
# 3-1). 查看
"""
查看所有: keys, values, items
查看局部: d[key], d.get(key), d.get(key, default-value)
"""
d = {"name":"westos", "age":18, "city":"西安"}
print(d.keys())  # 查看字典所有的key值
print(d.values())  # 查看字典所有的value值
print(d.items()) # 查看字典所有的key-value值(item元素)
print(d['name'])   # 查看key为name对应的value值
# print(d['province'])   # 查看key对应的vlaue值,如果不存在会报错。
print(d.get('province'))  # 查看key对应的vlaue值, 如果存在则返回,如果不在在则返回None.
print(d.get('province', "陕西"))  # 查看key对应的vlaue值, 如果存在则返回,如果不在在则返回默认值.

# 3-2). 增加和修改
d = {"name":"westos", "age":18}
d['city'] = "西安"   # key不存在就添加
print(d)
d['city'] = "北京"   # key存在则修改value值
print(d)

d = {"name":"westos", "age":18}
d.setdefault('city', "西安")  # key不存在就添加
print(d)
d.setdefault('city', "北京") # key存在,则do nothing
print(d)

# 3-3). 删除
d = {"name":"westos", "age":18}
d.pop('name')
print(d)
d = {"name":"westos", "age":18}
del d['name']
print(d)


# 4. 遍历字典(for)
d = {"name":"westos", "age":18, "city":"西安"}
# 默认情况下,字典只会遍历key值
for item in d:
    print(item)

# 如果遍历字典的key和value呢?(特别特别重要)
for key,value in d.items():  # [('name', 'westos'), ('age', 18), ('city', '西安')]
    print(f"key={key}, value={value}")

6.4 字典的拓展defaultdict

from collections import  defaultdict

# 默认字典,设置默认value
d = defaultdict(int)
d['views'] += 1
d['transfer'] += 1
print(d)

d = defaultdict(list)
d['allow_users'].append('westos')
d['deny_users'].extend(['user1', 'user2'])
print(d)

d = defaultdict(set)
d['love_movies'].add("黑客帝国")
d['dislike_movies'].update({'前任3', '电影xxxx'})
print(d)


6.5 数据类型的汇总

"""
1. 可变和不可变
- 可变数据类型: list, set, dict
- 不可变数据类型: 数值类型,tuple, str

2. 序列(有序和无序)和非序列
看ppt的脑图

"""

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值