文章目录
起步
众所周知,set() 是 Python 中的"天然去重因子"。对一串数据如:lyst = [1, 1, 2, 4, 4],我们常常 set 一下,也就是:set(lyst)
,达到去重目的。
那么,set() 是如何去重的呢?
自定义的数据结构
为了贴合实际的开发需求,我们常需要自定义数据结构。拿通用示例 Student 来说。
class Student(object):
def __init__(self, name, age, sid):
self.name = name
self.age = age
self.sid = sid
现在,我们实例两个 Student 对象,分别是 stu1 和 stu2,其名字 name,年龄 age,学号 sid 相同。现实生活中,可以认为这两个学生是同一人。
stu1 = Student("zhong", 15, 11198)
stu2 = Student("zhong", 15, 11198)
print(set([stu1, stu2]))
# 输出:{<__main__.Student object at 0x0030FE10>, <__main__.Student object at 0x0030FAD0>}
然而 set() 并不这样认为,因此没有实现去重效果。
__eq__函数
事实上,我们用比较操作符 ==
会发现,Python 解释器认为 stu1 并不等于 stu2。
print(stu1 == stu2) # 输出:False
会有上述现象,是因为程序没有按照现实需求运行。现实需求是:如果名字、年龄、学号都相同,那一定就是同一个人,因而我们需要重写魔法方法 __eq__()
。代码如下所示: