Mojo的特征与参数(参数化部分)详解

许多语言都具有元编程功能:即编写生成或修改代码的代码。Python 具有动态元编程功能:装饰器、元类等功能。这些功能使 Python 非常灵活且高效,但由于它们是动态的,因此会产生运行时开销。其他语言具有静态或编译时元编程功能,如 C 预处理器宏和 C++ 模板。这些功能可能受到限制且难以使用。

为了支持 Modular 在 AI 领域的工作,Mojo 旨在提供功能强大、易于使用且运行时成本为零的元编程。这种编译时元编程使用与运行时程序相同的语言,因此您无需学习新语言 - 只需学习一些新功能即可。

主要新功能是参数。您可以将参数视为编译时变量,该变量将成为运行时常量。这种“参数”用法可能与您在其他语言中习惯的用法不同,在其他语言中,“参数”和“参数”通常可以互换使用。在 Mojo 中,“参数”和“参数表达式”指的是编译时值,而“参数”和“表达式”指的是运行时值。

在 Mojo 中,您可以向结构或函数添加参数。您还可以定义命名参数表达式(别名),将其用作运行时常量。

参数化函数


要定义参数化函数,请在参数列表前面的方括号中添加参数。每个参数的格式与参数一样:参数名称,后跟冒号和类型(必填)。在以下示例中,该函数有一个参数count类型为Int。

fn repeat[count: Int](msg: String):
    @parameter
    for i in range(count):
        print(msg)

@parameter此处显示的指令导致在for编译时评估循环。仅当循环限制是编译时常量时,该指令才有效。由于count是参数, 因此range(count)可以在编译时计算。

调用参数化函数时,您可以为参数提供值,就像函数参数一样:

repeat[3]("Hello")

输出:

Hello
Hello
Hello

编译器在编译期间解析参数值,并为每个唯一参数值创建函数的具体版本repeat。解析参数值并展开循环后,该repeat3 函数大致相当于:

fn repeat_3(msg: String):
    print(msg)
    print(msg)
    print(msg)

这并不代表编译器生成的实际代码。在解析参数时,Mojo 代码已经转换为MLIR中的中间表示。

如果编译器无法将所有参数值解析为常量值,则编译失败。

参数和泛型


“泛型”是指可以作用于多种类型值的函数,或可以容纳多种类型值的容器。例如, List可以容纳不同类型的值,因此您可以拥有一个值列表Int,或一个String值列表。

在 Mojo 中,泛型使用参数来指定类型。例如,List 采用类型参数,因此整数向量写为List[Int]。因此,所有泛型都使用参数,但并非所有使用参数的东西都是泛型。

例如,repeat上一节中的函数包含类型为Int的形参和类型为String的实参。它是参数化的,但不是泛型的。泛型函数或结构体在类型上是参数化的。例如,我们可以重写repeat以采用符合以下Stringable特征的任何类型的参数:

fn repeat[MsgType: Stringable, count: Int](msg: MsgType):
    @parameter
    for i in range(count):
        print(msg)

# Must use keyword parameter for `count`
repeat[count=2](42)

输出:

42
42

此更新的函数接受任何Stringable类型,因此您可以向其传递Int、 String或Bool值。
另外一个示例:

fn repeat[MsgType: Stringable, count: Int](msg: MsgType):
    @parameter
    for i in range(count):
        print(msg)
def main():
    # Must use keyword parameter for `count`
    repeat[count=2]("zhangsan")

输出:

zhangsan
zhangsan

如果不指定 ,则不能将count作为位置关键字传递MsgType。您可以将其放在//后面MsgType以指定它始终由参数推断。现在您可以按count位置传递以下参数:

fn repeat[MsgType: Stringable, //, count: Int](msg: MsgType):
    @parameter
    for i in range(count):
        print(msg)

# MsgType is always inferred, so first positional keyword `2` is passed to `count`
repeat[2](42)

Mojo 对泛型的支持还处于早期阶段。您可以使用特征和参数编写这样的泛型函数。您还可以编写像 List和这样的泛型集合。

参数化结构


您还可以向结构体添加参数。您可以使用参数化结构体来构建通用容器。例如,通用数组类型可能包含如下代码:

from memory.unsafe_pointer import UnsafePointer, initialize_pointee_copy, destroy_pointee

struct GenericArray[ElementType: CollectionElement]:
    var data: UnsafePointer[ElementType]
    var size: Int

    fn __init__(inout self, *elements: ElementType):
        self.size = len(elements)
        self.data = UnsafePointer[ElementType].alloc(self.size)
        for i in range(self.size):
            initialize_pointee_move(self.data.offset(i), elements[i])

    fn __del__(owned self):
        for i in range(self.size):
            destroy_pointee(self.data.offset(i))
        self.data.free()

    fn __getitem__(self, i: Int) raises -> ref [__lifetime_of(self)] ElementType:
        if (i < self.size):
            return self.data[i]
        else:
            raise Error("Out of bounds")

该结构体有一个参数,ElementType它是您想要存储在数组中的数据类型的占位符,有时称为类型参数。ElementType其类型为 CollectionElement,它是一种 表示可以复制和移动的任何类型的特征。

与参数化函数一样,使用参数化结构体时需要传入参数值。在这种情况下,创建的实例时 GenericArray,需要指定要存储的类型,如Int、 或 Float64。(这有点令人困惑,因为在这种情况下传递的参数值是类型。没关系:Mojo 类型是有效的编译时值。)

您将看到它ElementType在整个结构体中被使用,而您通常会看到类型名称。例如,作为elements构造函数中的正式类型,以及方法的返回类型__getitem__()。

以下是使用的示例GenericArray:

var array = GenericArray[Int](1, 2, 3, 4)
for i in range(array.size):
    print(array[i], end=" ")

输出:

1 2 3 4

参数化结构体可以使用类型Self来表示结构体的具体实例(即指定了所有参数)。例如,您可以添加一个静态工厂方法,GenericArray其签名如下:

struct GenericArray[ElementType: CollectionElement]:
    ...

    @staticmethod
    fn splat(count: Int, value: ElementType) -> Self:
        # Create a new array with count instances of the given value

这里,Self相当于写成GenericArray[ElementType]。也就是说,你可以像splat()这样调用该方法:

GenericArray[Float64].splat(8, 0)

该方法返回 的一个实例GenericArray[Float64]。

案例研究:SIMD类型


为了得到参数化类型的真实示例,让我们看一下Mojo中的SIMD标准库中的类型。

单指令多数据 (SIMD)是许多现代 CPU、GPU 和自定义加速器内置的并行处理技术。SIMD 允许您同时对多个数据执行单个操作。例如,如果您想对数组中每个元素求平方根,则可以使用 SIMD 来并行化工作。

处理器使用硬件中的低级向量寄存器来实现 SIMD,这些寄存器可保存标量数据类型的多个实例。为了在这些处理器上使用 SIMD 指令,必须将数据调整为适当的 SIMD 宽度(数据类型)和长度(向量大小)。处理器可能支持 512 位或更长的 SIMD 向量,并支持从 8 位整数到 64 位浮点数的多种数据类型,因此定义所有可能的 SIMD 变体并不实际。

Mojo 的SIMD类型(定义为结构)通过其方法公开常见的 SIMD 操作,并使 SIMD 数据类型和大小值参数化。这允许您将数据直接映射到任何硬件上的 SIMD 向量。

以下是 Mojo 类型定义的精简版(非功能性版本)SIMD:

struct SIMD[type: DType, size: Int]:
    var value:# Some low-level MLIR stuff here

    # Create a new SIMD from a number of scalars
    fn __init__(inout self, *elems: SIMD[type, 1]):  ...

    # Fill a SIMD with a duplicated scalar value.
    @staticmethod
    fn splat(x: SIMD[type, 1]) -> SIMD[type, size]: ...

    # Cast the elements of the SIMD to a different elt type.
    fn cast[target: DType](self) -> SIMD[target, size]: ...

    # Many standard operators are supported.
    fn __add__(self, rhs: Self) -> Self: ...

因此,您可以像这样创建和使用 SIMD 向量:

var vector = SIMD[DType.int16, 4](1, 2, 3, 4
  • 35
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

启航学途

您的鼓励将是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值