python 指针_第3篇:Cython的指针、结构体、基础运算符

Cython的C指针

与C一样,尽管指针性与变量而不是类型相关联,但可以在类型或变量附近声*号。

%%cython
cdef int *a
cdef int *b

但这样在变量a,b写在一行,cython编译器会发出警告的信息,因此建议每个变量单独声明

%%cython

cdef int *a,*b

fd54f117bf779e6990815f37c3ae9027.png

Cython中的指针的解引操作

在Cython中解引用指针与在C语言中不同。
由于Python语言已经使用*args和**kwargs语法来允许任意位置和关键字参数并支持函数参数解包,因此Cython不支持*

*解引语法是C指针的语法。 取而代之的是,我们在位置0的指针处建立索引,以解引Cython中的指针的引用。 这种语法也可以解引C中的指针,尽管这种情况很少见。

8a2c3f7af0e35cb9e392a51476b46c4c.png

Cython的结构体与指针

无论在C中使用箭头运算符的任何地方,在Cython中的结构体都使用点运算符访问其内部的成员变量,Cython将生成正确的C级代码

%%cython -a

cdef struct Person:
    char* name
    unsigned int age
#end-cdef

#初始化结构体
cdef Person p=Person("jck308",32)

#声明Person类型结构体指针p_per
#并将变量p的地址赋值给指针p_per
cdef Person *p_per=&p

#访问结构体的成员
print(p.age)
print(p.name)

print(p_per.age)
print(p_per.name)

混合静态和动态类型变量

Cython允许静态和动态类型变量之间的赋值。静态和动态的这种流体混合是一个强大的特性,我们将在多个实例中使用它:它允许我们对大多数代码基使用动态Python对象,并轻松地将它们转换为性能关键部分加速、静态类型的类比。

举例来说,假设我们有几个静态int,我们想将它们组合成(动态)Python元组。使用Python/C API创建和初始化这个元组的C代码很简单,但是很繁琐,需要几十行代码,并且需要大量的错误检查。在Cython,显而易见的方法就是:

%%cython

#静态类型的变量
cdef int a=1,b=2,c=3

##动态类型的变量
tuple_of_ints=(a,b,c)

print(tuple_of_ints)

这段代码很无聊。 这里要强调的一点是,a,b和c是静态类型的整数,而Cython允许使用它们创建动态类型的Python元组。 然后,我们可以将该元组分配给动态键入的tuple_of_ints变量。 该示例的简单性是Cython强大之处:我们可以以显而易见的方式创建一个C类型int元组,而无需进一步思考。 我们希望像这样的概念上简单的事情变得简单,这就是Cython所提供的。

此示例之所以有效,是因为C类型的int与Python int之间存在明显的对应关系,因此Python可以为我们自动类型转换。 例如,如果a,b和c是C指针,则此示例无法按原样工作。 在这种情况下,我们必须解引它们,然后再将它们放入元组或使用其他策略。

例如下面的代码是个错误的例子,因为Python解释器无法识别指针类型的变量

%%cython

cdef int k=55,j=56

cdef int *a=&k
cdef int *b=&j

tuple_of_ints=(a,b)
print(tuple_of_ints)

正确的做法,如下图所示,我们通过解引指针变量a、b

9238309542f26f7ff22f263f7be2011f.png

给出了内置Python类型与C或C ++类型之间对应关系的完整列表

31d65eff450707c6c622ebefa9772063.png

Cythond的bint类型

bint布尔整数类型是C级别的int,并与Python的bool相互转换。 它具有真实性的标准C解释:零为False,非零为True。

整数类型转换和溢出

Python 3中,所有int对象都是无限精度的。当将整数类型从Python转换为C时,Cython会生成检查溢出的代码。 如果C类型不能表示Python整数,则会引发运行时OverflowError。

55949ea8229fd0241ad01366360c6473.png

float类型转换

Python fload存储为C double。 根据IEEE 754转换规则,将Python浮点数转换为C浮点数可能会截断为0.0或正负无穷大。
Cython的double类型会被动态转换Python的float类型

%%cython

cdef double d=384848048282945060321.3835
b=d

print(b)
print(type(b))

978b407558d42f4b5c707831c7ef40d7.png

Complex类定

The Python complex类型存储为两个double的C结构,Cython具有浮点复数和双复数C级类型,它们对应于Python复数类型。 C类型与Python复杂类型具有相同的接口,但是使用有效的C级操作。 这包括访问实数和虚数分量的实数和imag属性,创建多个复数共轭的共轭方法,以及用于加,减,乘和除的有效运算。C级Complex类型与C99 _Complex类型或C ++ std :: complex模板化类兼容。

bytes类型

Python字节类型会自动在char *或std :: string之间来回转换。下面示例就是Cython char类型指针 动态转换为Python的bytes

%%cython

cdef char* s="Hello World"
b=s

print(b)
print(type(b))

用Python类型静态声明变量

到目前为止,我们一直使用cdef静态声明C类型的变量。 也可以使用cdef静态声明Python类型的变量。 我们可以对内置类型(例如list,tuple和dict)执行此操作; 扩展类型,例如NumPy数组; 还有很多其他

并非所有的Python类型都可以静态声明:它们必须用C实现,并且Cython必须有权访问该声明。 内置的Python类型已经满足了这些要求,并且声明它们很简单。 例如Python典型的集合类型list,dict,str,set(str就是集合类型,字符串数组):

cdef list mylist
cdef dict mydi
cdef str pname
cdef set myset

此示例中的变量是完整的Python对象。 在后台,Cython将它们声明为指向某些内置Python结构类型的C指针。 它们可以像普通的Python变量一样使用,但是受其声明类型的约束:

%%cython

cdef list mylist=[k+1 for k in range(1,11)]

pylist=mylist

print("mylist:",mylist)

print("删除pylist索引2的元素")
del pylist[2]
print(mylist)

在这里,通过删除pylist第3个元素也会删除mylist的第3个元素,因为它们引用的是同一列表。mylist和pylist之间的一个区别是,mylist只能引用Python列表对象,而pylist可以引用任何Python类型。 Cython将在编译时和运行时对mylist施加类型约束。

26703e54b478a4db886dd92766ed9c03.png

备注:关于Cython更复杂的数组类型引用,可以参考此篇文章《第5篇:Cython的线性表性操作》

乍一看,Cython允许静态声明具有内置Python类型的变量似乎有些奇怪。 为什么不照常使用Python的动态类型? 答案指出了Cython的一般原理:我们提供的静态类型信息越多,Cython就能更好地优化结果。 像往常一样,该规则也有例外,但这通常是正确的。 例如,以下代码从Cython函数中返回sieveOfEratosthenes()返回一个cdef list的对象附加到动态类型的变量中:

%%cython 
#cython:language_level=3

cpdef list sieveOfEratosthenes(int n):
    cdef list pr = [True for i in range(n + 1)]
    cdef int p = 2
    cdef list res=list()
    
    while (p * p <= n):
        if (pr[p] == True):
            for i in range(p * p, n + 1, p):
                pr[i] = False
            #end-for
        #end-if
        p += 1
    #end-while
    
    cdef int k
    
    for k in range(2,n):
        if pr[k]:
            res.append(k)
        #end-if
    #end-for
    return res
#end-def


#这是Python动态类型的list
primers=[]

primers=sieveOfEratosthenes(9)

print(primers)

print("调用append方法")
primers.append(11)
print(primers)

程序输出

f16e6a34cbcd636a76f25bd0d8696ab7.png

Cython编译器将生成可处理任何Python对象的代码,并在运行时测试primers是否为列表。如果不是,只要它具有带参数的append方法,该代码就会运行。在后台,生成的代码首先在primers对象上查找append属性(使用PyObject_GetAttr),然后使用完全通用的PyObject_Call Python / C API函数调用该方法。 这实质上模拟了当运行等效的Python字节码时Python解释器将执行的操作。

假设上面的代码中primers变量我们使用静态声明

cdef list primers

现在,Cython可以生成专门的代码,这些代码可以直接从C API调用PyList_SET_ITEM或PyList_Append函数。 这就是上一示例中的PyObject_Call最终仍然要调用的内容,但是静态类型允许Cython绕过了Python解释器在动态调度(Dynamic Dispatch)一系列繁琐沉重的类型检测(内部类型指针查找),这也是Cython的静态版本list比Python动态版本list性能高效的原因。

关于Python解释器的动态调度的详细介绍,请查看此文《第2篇:Cython VS Python 执行原理》

Cython当前支持的集中内置可静态声明的Python类型,我们常用静态声明的可能就是list,dict

  • type,object
  • bool
  • complex
  • basestring,str,unicode,bytes,bytearray
  • list,tuple,dict,set,frosenset
  • array
  • slace
  • date,time,datetime,timedelta,tzinfo

上面的列出的中不包括直接C对应的Python类型(例如int,long和float)。 事实证明,在Cython中静态声明和使用PyIntObjects,PyLongObjects或PyFloatObjects并不容易。 幸运的是,这样做的需要很少。 我们只声明常规的C基本数据类型int,long,float和double,然后让Cython为我们进行往返于Python的自动转换。

数字字面量的基本运算

当我们对数字字面量进行加,减或乘运算时,当操作数是动态类型化的Python对象时,这些操作具有Python语义(包括对于数值大的自动Python long强制转换)。当操作数是静态类型的C变量时,它们具有C语义(即,对于有限精度的整数类型,结果可能会溢出)

除数和模数(即计算余数)值得特别提及。使用带符号整数操作数计算模数时,C和Python具有明显不同的行为:C舍入为零,而Python舍入为无穷。例如,使用Python语义时,-1%5的结果为4;但是,如果使用C语义,它将得出-1。当将两个整数相除时,Python始终检查分母,并在其为零时引发ZeroDivisionError,而C没有适当的保护措施。

对于除法/取模运算中,即便指定了C类型的静态数字变量,Cython的行为是倾向于Python的,要获取与C/C++完全相同的语义,我们可以在全局模块级别或在指令注释中使用cdivision编译器指令,如下示例所示

1d024c2711d5eeae9ff815622dd05628.png


在Python 3中,在C级别,所有整数都是PyLongObjects。Cython以与语言无关的方式在C整数类型和这些Python整数类型之间正确转换,并在无法进行转换时引发OverflowError。

当我们在Cython中使用Python对象时,无论是静态声明还是动态声明,Cython仍将为我们管理对象的所有方面,包括繁琐的引用计数。

Cython的字符串

这里我 谈到Cython中的引用计数和静态的字符串类型。Python的主要功能之一是自动内存管理。 CPython通过简单的引用计数来实现这一点,它具有一个自动运行的垃圾收集器,该垃圾收集器会定期运行以清理不可达的引用周期。Cython会为我们处理所有引用计数,确保Python对象(无论是静态类型的还是动态的)在其引用计数达到零时完成。

在Cython中混合使用静态和动态变量时,CPython的自动内存管理具有一定的意义。 举例来说,我们有两个Python字节对象b1和b2,我们想在将它们加在一起后提取底层的char指针:

%%cython

s1=b"Hello "
s2=b"World"

cdef char *buf=s1+s2

s1 + s2表达式是一个临时的Python字节对象,分配时会尝试使用Cython的自动转换规则提取该临时对象的char指针。 由于添加的结果是一个临时对象,因此前面的示例无法正常工作-添加的临时结果在创建后立即删除,因此char缓冲区不能引用有效的Python对象。 幸运的是,Cython能够捕获该错误并发出编译错误。

b51a95779e541d4812404d8dff30c365.png

一旦理解,正确的处理方法就很简单-只需使用一个临时Python变量,是动态变量的:

%%cython

s1=b"Hello "
s2=b"World"

s=s1+s2
cdef char *buf=s

或者我们可以静态指定一个C类型的bytes

%%cython

s1=b"Hello "
s2=b"World"

cdef bytes s=s1+s2
cdef char *buf=s

这些情况并不常见。这只是一个问题,因为C级对象引用的是由Python对象管理的数据。因为Python对象拥有基础字符串,所以C char*缓冲区无法告诉Python它具有另一个(非Python)引用。我们必须创建临时字节对象,以便Python不会删除字符串数据,并且必须确保只要需要C char *缓冲区,就可以维护临时对象。表3-2中列出的其他C类型都是值类型,而不是指针类型。对于这些类型,Python数据在赋值期间被复制(C语义),从而允许C变量与用于初始化它的Python对象独立存在。

正如Cython理解动态Python变量和静态C变量一样,它也理解两种语言的函数,并允许我们使用两种语言。Cython的预封装的类库也支持C++版本的string类型。我们再其他篇章会提及到。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值