存储是“unboxed”,但每次你访问一个元素Python必须“框”它(嵌入在一个普通的Python对象),以便做任何事情。例如,你的sum(A)遍历数组,并在一个普通的Python int对象中每个一个整数,一个一个框。这需要时间。在你的总和(L)中,所有的拳击都是在创建列表时完成的。
因此,最后,数组通常较慢,但是需要相当少的存储器。
这里是最近版本的Python 3的相关代码,但是相同的基本思想适用于所有CPython实现,因为Python首次发布。
以下是访问列表项的代码:
PyObject *
PyList_GetItem(PyObject *op, Py_ssize_t i)
{
/* error checking omitted */
return ((PyListObject *)op) -> ob_item[i];
}
有很少的事情:somelist [i]只返回列表中的第i个对象(并且CPython中的所有Python对象都是指向一个结构体的指针,其初始段符合一个结构体PyObject的布局)。
下面是具有类型代码l的数组的__getitem__实现:
static PyObject *
l_getitem(arrayobject *ap, Py_ssize_t i)
{
return PyLong_FromLong(((long *)ap->ob_item)[i]);
}
原始内存被视为平台本地C长整数的向量;第i个C长被读出;然后PyLong_FromLong()被调用来包装(“盒子”)本地C长在Python长对象(在Python 3,它消除了Python 2的区分int和长,实际上显示为类型int)。
这个拳击必须为一个Python的int对象分配新的内存,并将原生的C长的位喷入它。在原始示例的上下文中,此对象的生命周期非常短暂(只是足够长以使sum()将内容添加到运行总计),然后需要更多的时间来释放新的int对象。
这是速度差异的来源,总是来自于,而且总是来自于CPython实现。