前言
前面的章节都是概括性的描述Python源码中,对象的创建、特性、使用、销毁等,这一章开始我们就要开始分析Python的常见内置类型对象以及对应的实例对象,看看底层具体是如何事项的。
第一个要分析的是浮点数,因为浮点数相比其他类型比较简单,所以我们第一个先拿浮点数开刀!
浮点数的创建与销毁
对象的结构
浮点数的定义在Include/floatobject.h中,结构比较简单:
typedef struct {
PyObject_HEAD
double ob_fval;
} PyFloatObject;
结构图如下:
除了PyObject这个公共的头部信息之外,只有一个额外的ob_fval,用于存储具体的值,并且使用的是C中的double。我们以f = 6.6为例,底层结构如下:
整体结构很简单,每个对象在底层都是由结构体表示的,这些结构体中有的成员负责维护对象的元信息,有的成员负责维护具体的值。上图的6.6,首先我们需要一个字段来维护6.6这个值,而这个字段就是ob_fval。所以浮点数的结构非常简单,直接使用一个C的double来维护。
当我们要将两个浮点数相加,方法前面几章已经提过,通过PyFloat_AsDouble,将两个PyFloatObject中的ob_fval抽出来,转成C的double,然后进行相加,最后再把相加的结果创建一个新的PyFloatObject即可。
具体代码如下:
static PyObject *
float_add(PyObject *v, PyObject *w)
{
double a,b;
CONVERT_TO_DOUBLE(v, a);
CONVERT_TO_DOUBLE(w, b);
a = a + b;
return PyFloat_FromDouble(a);
}
浮点数(float实例对象)的结构我们已经很清晰了,那么我们再来看看float类型对象在底层的结构。与实例对象不同,float类型对象全局为一,底层对应定义好的静态全局变量PyFloat_Type,位置在Objects/floatobject.c中。
PyTypeObject PyFloat_Type = {
PyVarObject_HEAD_INIT(&PyType_Type, 0)
"float",
sizeof(PyFloatObject),
0,
(destructor)float_dealloc, /* tp_dealloc */
0, /* tp_print */
0, /* tp_getattr */
0, /* tp_setattr */
0, /* tp_reserved */
(reprfunc)float_repr, /* tp_repr */
&float_as_number, /* tp_as_number */
0, /* tp_as_sequence */
0, /* tp_as_mapping */
(hashfunc)float_hash, /* tp_hash */
0, /* tp_call */
(reprfunc)float_repr, /* tp_str */
PyObject_GenericGetAttr, /* tp_getattro */
0, /* tp_setattro */
0, /* tp_as_buffer */
Py_TPFLAGS_DEFAULT | Py_TPFLAGS_BASETYPE, /* tp_flags */
float_new__doc__, /* tp_doc */
0, /* tp_traverse */
0, /* tp_clear */
float_richcompare, /* tp_richcompare */
0, /* tp_weaklistoffset */
0, /* tp_iter */
0, /* tp_iternext */
float_methods, /* tp_methods */
0, /* tp_members */
float_getset, /* tp_getset */
0, /* tp_base */
0, /* tp_dict */
0, /* tp_descr_get */
0, /* tp_descr_set */
0, /* tp_dictoffset */
0, /* tp_init */
0, /* tp_alloc */
float_new, /* tp_new */
};
PyFloat_Type保存了很多关于浮点数的元信息,关键字段包括:
- tp_name字段保存了类型名称,是一个*char ,显然值为"float"
- tp_dealloc、tp_init、tp_alloc和tp_new字段是与对象创建销毁相关的函数
- tp_repr字段对应**repr**方法,生成语法字符串
- tp_str字段对应**str**方法,生成普通字符串
- tp_as_number字段对应数值对象支持的方法簇
- tp_hash字段是哈希值生成函数
PyFloat_Type很重要,作为浮点数的类型对象,它决定了浮点数的生死和行为。
浮点数的创建
下面我们来看看浮点数的创建过程,在前两章中,我们初步了解过创建实例对象的一般过程。对于内置类型的实例对象,可以使用Python/C API创建,也可以通过调用类型对象创建。
调用类型对象float创建实例对象,解释器执行的是类型对象type中的tp_call函数。tp_call中会先调用类型对象(这里是float)的tp_new为其实例对象申请一份空间,申请完毕之后对象就已经创建好了。然后会再调用tp_init,并将实例对象作为参数传递进去,进行初始化,也就是设置属性。
但是对于float来说,它内部的tp_init成员是0,从PyFloat_Type的定义我们就可以看到。这就说明float没有__init__,原因是浮点数是一种很简单的对象,初始化操作只需要一个赋值语句,所以在tp_new中就可以完成。怎么理解这句话呢?我们举个栗子:
class Girl1:
def __init__(self, name, age):
self.name = name
self.age = age
# __new__ 负责开辟空间、生成实例对象
# __init__ 负责各实例对象绑定属性
# 但其实__init__所做的工作可以直接在__new__当中完成
# 换言之有 __new__ 就足够了,其实可以没有 __init__
# 我们将上面的例子改写一下
class Girl2:
def __new__(cls, name, age):
instance = object.__new__(cls)
instance.name = name
instance.age = age
return instance
g1