集合
集合(set)是一个无序的不重复元素序列
{1,2,3,4,1,2,3} = {1,2,3,4}
创建
1). 使用大括号 { } 或者 set() 函数创建集合
2). 注意:创建一个空集合必须用 set() 而不是 { }
{ } 是用来创建一个空字典
集合内置方法
集合应用案例1(列表去重)
在抓取页面图片时,为避免重复抓取,将抓取的img结果(结果集是list类型的)通过集合去重
方法一: 依次遍历并判断
# 代码
ids = [1,1,2,2,3,4,5,6,6,6,8,9,10,8,9]
new_ids = []
for item in ids:
if item not in new_ids:
new_ids.append(item)
print(new_ids)
# 运行结果
[1, 2, 3, 4, 5, 6, 8, 9, 10]
方法二: 通过set方法进行处理
# 代码
new_ids = list(set(ids))
print(new_ids)
#运行结果
[1, 2, 3, 4, 5, 6, 8, 9, 10]
集合应用案例2(明明的随机数)
明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性,他先用计算机生成了N个1到1000之间的随机整数(N≤1000),对于其中重复的数字,只保留一个,把其余相同的数去掉,不同的数对应着不同的学生的学号。然后再把这些数从大到小排序,按照排好的顺序去找同学做调查。请你协助明明完成“去重”与“排序”的工作(同一个测试用例里可能会有多组数据,希望大家能正确处理)
# 代码
import random
ids = []
for item in range(20): # 产生20个1-1000之间的随机数
id = random.randint(1, 1000)
ids.append(id)
print(ids) # 原始列表
print(len(ids)) # 列表长度为20,符合设置
ids_set = list(set(ids)) # 去重后列表
print(ids_set)
print(len(ids_set)) # 去重后列表长度为19
ids_set.sort() # 排序后的列表
print(ids_set)
# 运行结果
[773, 436, 745, 157, 842, 337, 804, 262, 51, 720, 322, 935, 436, 384, 56, 9, 668, 748, 916, 42]
20
[384, 773, 262, 9, 916, 668, 157, 804, 935, 42, 51, 436, 56, 322, 842, 720, 337, 745, 748]
19
[9, 42, 51, 56, 157, 262, 322, 337, 384, 436, 668, 720, 745, 748, 773, 804, 842, 916, 935]
集合应用案例3(微信共同好友)
random, math: 内置模块
itchat是一个开源的微信个人号接口,使用python调用微信从未如此简单。
思路: 1). 通过itchat微信个人号接口扫码登录个人微信网页版,获取可以识别好友身份的数,此项目需要分别登录两人微信的,拿到两人各自的好友信息存到列表中
2). 查共同好友就转化成了查两个列表中相同元素的问题,获取到共同好友信息后,可以通过命令行窗口print出来,也可以写入txt文件
Python查看微信共同好友- 信息详解及含义