集合
集合(set)是一个无序的不重复元素序列。1,2,3,4,1,2,3 = 1,2,3,4
集合的创建:
1). 使用大括号 { } 或者 set() 函数创建集合;
2). 注意:
l 创建一个空集合必须用 set() 而不是 { }
l { } 是用来创建一个空字典。
集合的内置方法
集合的增加
1). 集合的增加
add: 添加单个元素到集合中
update: 添加多个元素到集合中
集合的删除
2). 集合的删除
remove: 如果元素存在, 直接删除, 如果不存在, 抛出异常KeyError。
discard:如果元素存在, 直接删除, 如果不存在, do nothing。
pop:随机删除指定元素, 并返回删除的值。
clear:清空集合。
##### 去重的几种方法
去重的几种方法:
#列表去重
#方法一:依次遍历并判断
array = [1,2,3,5,3,2,5,5,4]
new_array = []
for id in array:
if id not in new_array:
new_array.append(id)
print(new_array)
#方法二:使用set方法进行处理
array = [1,2,3,5,3,2,5,5,4]
#先将列表转化为集合,因为集合是一个无序的不重复的元素序列
new_array = list(set(array))
print(new_array)
华为笔试题
明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性,他先用计算机生成了N个1到1000之间的
随机整数(N≤1000),对于其中重复的数字,只保留一个,把其余相同的数去掉,不同的数对应着不同的学生的学号。然后再把这些数从大到小排序,按照排好的顺序去找同学做调查。请你协助明明完成“去重”与“排序”的工作(同一个测试用例里可能会有多组数据,希望大家能正确处理)。
代码如下:
import random
nums = set()
N = int(input('N:'))
for count in range(N):
num = random.randint(1,1000)
nums.add(num)
print(sorted(nums,reverse=True))
frozenset
frozenset 是 set 的不可变版本,因此 set 集合中所有能改变集合本身的方法(如 add、remove、discard、xxx_update 等),frozenset 都不支持;set 集合中不改变集合本身的方法,fronzenset 都支持。
frozenset 的这些方法和 set 集合同名方法的功能完全相同。frozenset 的作用主要有两点:
• 当集合元素不需要改变时,使用 frozenset 代替 set 更安全。
• 当某些 API 需要不可变对象时,必须用 frozenset 代替set。比如 dict 的 key 必须
是不可变对象,因此只能用 frozenset;再比如 set 本身的集合元素必须是不可变的,因此 set 不能包含 set,set 只能包含 frozenset。
set1 = frozenset({1,2,3,4})
print(set1,type(set1))
set2 = {1,2,set1}
print(set2,type(set2))
字典
字典是另一种可变容器模型,且可存储任意类型对象。
键一般是唯一的,如果重复最后的一个键值对会替换前面的,值不需要唯一。
字典的创建与删除
#####简单字典的创建
#1). 字典可以快速通过key值查询到value值。O(1)
#2). key值是不能重复的, value值无所谓
#3). 字典的key值必须是不可变的数据类型, value值可以是任意数据类型。
#info = {
#'name':'root',
#'passwd':'westos',
#'member':['kiosk','student']
#}
#print(type(info))
#print(info['name'])
#print(info)
内建方法:()fromkeys(key,value)用来创建多个value值相等的字典
import pprint
cards = []
for count in range(100):
num = "%.3d" %(count+1)
card = '6103452' + str(num)
cards.append(card)
#生成value值一样的字典
cards_info = {}.fromkeys(cards,'wesotos')
pprint.pprint(cards_info)
zip间接创建
zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的对象,这样做的好处是节约了不少的内存。我们可以使用 list() 转换来输出列表或者dict()转换来输出字典。如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压为列表。
#zip间接创建字典
info = zip([‘name’,‘passwd’],[‘root’,‘westos’])
#print(list(info)) #结果是由两个元组组成的一个列表
print(dict(info)) #结果返回的是一个字典
字典的内建方法
1).字典的查看方法
#字典的查看方法
students = {
'user1':[100,100,100],
'user2':[97,74,90],
'user3':[80,96,99]
}
#1、通过字典的Key获取对应的value值
#print(students['user1'])
#print(students['user2'])
#2、get方法:
#特别重要: get方法: 如果key存在获取对应的value值,
#反之,
返回默认值(如果不指定,默认返回的是None)
#print(students.get('user1'))
#print(students.get('user4','no user'))
#3、查看所有的key值/value值/key-value值
print(students.keys())
print(students.values())
print(students.items())
2)循环遍历字典
students = {
'user1':[100,100,100],
'user2':[97,74,90],
'user3':[80,96,99]
}
#字典遍历时默认遍历的是字典的key值
for key in students:
print(key,students[key])
print('*'*10)
#遍历字典key-value建议的方法
for key,value in students.items():
print(key,value)
3)字典的增加方法
students = {
'user1':[100,100,100],
'user2':[97,74,90],
'user3':[80,96,99]
}
#1). 根据key增加 /修改key-value
如果key存在, 修改key-value
#如果key不存在, 增加key-value
students['user3'] = [11,22,33]
print(students)
#2). setdefault方法
如果key存在, 不做任何操作
#如果key不存在, 增加key-value
students.setdefault('user4',[44,55,66])
print(students)
#3). update方法: 批量添加key-value
如果key存在, 修改key-value
如果key不存在, 增加key-value
```python
new_students = {
'westos':[100,199,100],
'root':[23,54,63],
'user1':[0,0,0]
}
students.update(new_students)
print(students)
字典去重:
#方法三:通过字典的方式去重, 因为字典的key值是不能重复的.
array = [1,2,3,5,3,2,5,5,4]
new_array = {}.fromkeys(array).keys()
print(list(new_array))
print(new_array)
print(type(new_array))
默认字典defaultdict
collections.defaultdict类,本身提供了默认值的功能, 默认值可以是整形,列表,集合等.
defaultdict 是 dict 的子类。但它与 dict 最大的区别在于,如果程序试图根据不存在的 key 访问 value,会引发KeyError 异常;而 defaultdict 提供default_factory 属性,该为不存在的 key 来自动生成生成默认的 value。
需求:我们想要一个能将键(key)映射到多个值的字(即所谓的一键多值字典)
解决方案:
1). 字典是一种关联容器,每个键都映射到一个单独的值上。如果想让键映射到多个值,需要将这些多个值保存到容器(列表或者集合)中。
2). 利用collections模块中的defaultdict类自动初始化第一个值,这样只需关注添加元素.
默认字典_案例
需求:用defaultDict来做一个练习,把list(随机生成50个1-100之间的随机数)中大于66的元素和小于66的元素
{
‘大于66的元素’: [71,8 2, ,83],
‘小于66的元素’: [1, 2, 3],
}
代码:
from collections import defaultdict
import random
N = 50
li = defaultdict(list)
for count in range(N):
i=random.randint(1,100)
if i > 66:
li['大于66的元素'].append(i)
else:
li['小于66的元素'].append(i)
print(li)
md5加密的实现
MD5消息摘要算法(英语:MD5 Message-Digest Algorithm),一种被广泛使用的密码
散列函数,可以产生出一个128位(16字节)的散列值(hash value),用于确保信息传
输完整一致。MD5是最常见的摘要算法,速度很快,生成结果是固定的128 bit字节,通
常用一个32位的16进制字符串表示。
MD5目前人类是无法解密的,目前人类的MD5解密方法是建立一个大型数据库,将各
个人的MD5数据存储在这个数据库里面,然后将所需要解密的密码放入该库对比找到
同样原码,如果没有对比到数据,说明该密没有被记录过,也就是说没有办法解密了。
Md5在线解密加密的流程:
生成加密数据库信息:
#tkinter
#PySimpleGUI
from string import digits
#Python的hashlib提供了常见的摘要算法,如MD5,SHA1等等。hashlib库进行md5加密,操作如下
import hashlib
#显示程序运行的进度条
from tqdm import tqdm
import json
db = {}
for item1 in tqdm(digits):
for item2 in digits:
for item3 in digits:
for item4 in digits:
for item5 in digits:
for item6 in digits:
passwd1 = item1 + item2 + item3 + item4 + item5 + item6
#md5加密需要的字符串是bytes类型, encode('utf-8')将utf-8的编码格式编码成bytes类型
passwd =passwd1.encode('utf-8')
md5_passwd =hashlib.md5(passwd).hexdigest()
db[md5_passwd] =passwd1
#将db字典的信息以json的格式存储到md5.json文件中
json.dump(db, open('md5.json', 'w'))
print("生成数据库成功.......")
######在线加密解密工具
import hashlib
import json
filename = 'md5.json'
db = json.load(open(filename))
choice = input("请选择您的操作(0-加密,1-解密):")
if choice == "0":
passwd = input("请输入需要加密的字符串:").encode('utf-8')
md5_passwd = hashlib.md5(passwd).hexdigest()
print("%s加密后的密码为:%s" % (passwd, md5_passwd))
elif choice == "1":
md5_passwd = input("请输入需要解密的字符串:")
#db中如有键值 md5_passwd,则返回相应的value值,即为True;否则返回None,即为False
passwd = db.get(md5_passwd)
if passwd:
print("%s解密后的明文为:%s" % (md5_passwd, passwd))
else:
print("%s无法进行解密" % md5_passwd)
else:
print("请输入正确选择")
python中的bytes,str类型, 以及编码解码
python3中有bytes和string类型
1、bytes主要是给在计算机看的,string主要是给人看的
2、中间有个桥梁就是编码规则,现在大趋势是utf8
3、bytes对象是二进制,很容易转换成16进制,例如\x64
4、string就是我们看到的内容,例如’abc’
5、string经过编码encode,转化成二进制对象,给计算机识别, 也就是bytes类型
6、bytes经过反编码decode,转化成string,但是注意反编码的编码规则是有范围,\xc8就不是utf8识别的范围