最近有许多小伙伴问我要入门 Python 的资料,还有小伙伴完全没有入门 Python 就直接购买了我的 pandas 专栏。因此我决定写几篇 Python 数据处理分析必备的入门知识系列文章,以帮助有需要的小伙伴们更好入门。
前言
关于 Python 中的类与对象相关知识,网络上已经有非常多的教程。但对于初学者来说,仍然是一个非常难以理解的事情。今天我尝试从一个奇怪的角度讲解使用类、对象相关知识。
本文需要读者已经了解 Python 中关于 列表、字典、自定义函数基本认知
物以类聚
每当我学习一个新的工具,都会自问:"为什么我需要他?"
假设我需要3位学生的相关数据(姓名、年龄、成绩),那么首先想到的可能是用列表表示。
其中有2种方式,第一种如下:
按属性归类,如上图,姓名单独一个列表
这显然是一种不合理的归类,因为需求往往是对一个学生做处理。
例如,打印第2位学生的信息:
总是要从多个列表中,取出某位置上的数据
如果需要定义统一的处理函数,那情况更加糟糕:
任何处理学生的函数都需要传入3个数据列表
一种更好的归类方式是:
每位学生一个列表
这解决了方式1的缺点,但是他仍然不完美。毕竟我们要记住姓名是在列表中的第一个位置上。
这是因为数据结构不合理,我们不应该使用列表。
那么,有什么结构能解决这痛点?
没错,就是字典:
此时字典中的 key 就是属性名字,对于的 value 就是值
现在任何处理函数直接传入某学生的信息字典即可:
但是,这还是不够完美,想想现在的学生信息字典只是保存了数据。
如果关于学生的操作也能保存在字典中,那么就完美了。
还真可以!
我们可以把函数保存在字典中:
注意字典中的 show_me 没有执行函数(因为没有在函数名字后写括号),只是保存了函数对象
那么当需要执行的时候,只需要:
因为 s2['show_me'] 相当于取出了函数 show_me 。而执行函数需要函数对象后用括号。
因此 s2'show_me' 相当于 show_me(s2)
最后,把创建学生信息字典的过程统一为一个函数:
完美!
如果不使用类与对象,相信这已经是最好的结果
但此时还是有一个瑕疵,当需要输出某学生的信息时,需要传入自身给予 show_me 函数:
这是在有点丑陋
更进一步
我们暂且把以上方式称为"字典实现"。
不管使用什么方式组织代码,我们的目的其实是为了更好围绕一个主题管理多个变量(例子中的学生即为主题,其中姓名、年龄、分数就是变量)。
类就是一种管理的手段,看看如何定义:
init 函数是初始化时会执行的函数
现在我们不关注 self 实际是什么,但是要知道 self.name = name ,这类似往字典写入了数据
是不是很像之前我们定义的 create_st ?
那么,如何得到一个学生(类比字典实现方式中一个学生信息字典)?非常简单:
类名 + 括号 ,这种操作称为"实例化",因为这会让我们得到一个实体(称之为"实例"),变量 s1 指向了这个实体
此时变量 s1 指向的对象,与字典非常相似,只是他访问数据的方式更加简洁:
对象变量 + 点 + 属性名字 ,即可访问对应的数据。这类似于 字典对象[属性名字]
别以为我是随意使用字典来类别这些概念:
自定义类型的定义决定了实体的结构。比如 __init__ 中执行的代码决定了字典有哪些 key 和 value
实例化一个实例,相当于生成了一个带数据的字典