P4编程理论与实践——理论篇(转载)

最新推荐文章于 2024-06-02 20:11:24 发布

人生亦逝

最新推荐文章于 2024-06-02 20:11:24 发布

阅读量1k

点赞数 1

文章标签：编程语言

原文链接：https://www.sdnlab.com/22466.html

版权

P4编程理论与实践——理论篇

由于对SDN充满着兴趣，在学习了一段时间OpenFlow之后，一次偶然的机会接触到了P4。P4可以实现很多新的Idea，但是无奈于国内的实践资料太少了（有些资料似乎比较陈旧了）。唯一的学习来源是官网的英文实例教程，但是摸索起来很费时间。因此本人打算把自己的探索经验，写成一个专题，和大家分享，学习，交流。着重点是实践而非理论，有不正确的地方欢迎批评指正。

为什么要从理论上开始介绍呢？因为有了一些基础的理论概念，才能更好的去编程，不会摸不着头脑。无论大家对SDN的理解如何，我觉得都有必要把一些基础的概念，如：数据面，控制面等概念了解清楚，了解为什么要有P4，与OpenFlow的区别是什么等等。知道了这些，会提高我们的学习效率和质量。

SDN 与 OpenFlow

相信大家对SDN和OpenFlow都非常了解了。如果是这样，可以直接跳过这个部分，直接阅读下一节。

SDN的概念

SDN(Software Defined Network，软件定义网络)。相对于传统网络，软件定义网络实现了控制平面与数据平面的分离，同时（至少在逻辑上）构建了一个集中的控制平面。人们可以在这个单一的控制平面上，实现对全网各个网元设备的监控，管理，编程。

数据平面：维护一个由一系列流表组成的(pipeline，流水线)。当数据包经过交换机时，首先会走的是数据平面，即去匹配这些表。根据匹配到的相应的规则（action），如output, drop。从不同的端口转发或者丢弃。但是FIB的信息是如何添加的呢？为什么FIB会知道数据包该从哪个端口转发呢？这就需要控制平面去管理它。
控制平面：不管是分布式的控制平面，还是集中式的控制平面。控制平面可以理解为网元设备的操作系统。他可以写一些程序，里面含有特定的算法，向数据平面添加相应的转发规则。也就是说，控制平面相当于网元设备的大脑，当数据平面不知道如何转发一个数据包时，会向大脑询问，大脑根据自己对网络拓扑的”认知“，向数据平面返回指定的规则，数据平面记录这条规则，在之后的转发过程中，就不再询问自己的大脑（速率较慢），而是根据“肌肉记忆”直接转发。

OpenFlow

OpenFlow的诞生和历史不做赘述。OpenFlow在SDN中扮演怎样一个地位呢？我们先来看一张图片：

我们知道，SDN的一个重要概念就是控制平面和数据平面的分离，以及集中式的控制平面，这个集中的控制平面就是我们所说的控制器。那么控制平面与数据平面分离之后，如何像往常一样管理数据平面呢？因此，在分离后的控制平面和数据平面之间，只能通过一个特定的协议进行交互，这个协议就是我们的OpenFlow协议。也就是上图所示的1. Open interface to packet forwarding.

所以, OpenFlow协议有如下特点：

定义了用于控制器和数据平面（各个OpenFlow交换机）交互的报文格式。
OpenFlow必须是一个 target-independent 的协议，所谓target-independent就是与特定的交换机无关，能够提供一种抽象，从而可以以统一的接口管理网络中所有的设备，从而实现一个逻辑集中的控制平面。
OpenFlow作为一种南向协议，其与其他南向接口的对比如下。

这张图放的有点早了，但是可以看到OpenFlow虽然实现了Target-independent，但是没有实现Protocol-independent。这个是OpenFlow的最主要的缺陷之一，这也是引入P4的最主要的原因。什么是Protocol-independent呢？请继续看。

OpenFlow的缺陷

OpenFlow虽然为SDN奠定了基础。但是在进行应用开发的时候有一个很大的局限，就是OpenFlow没有真正做到协议不相关。也就是说，OpenFlow只能依据现有的协议来定义流表项。打个比方，就好像OpenFlow给了我们几个固定形状的积木，让我们自行组装，却不能让我们自己定义积木的形状。这就是OpenFlow的局限所在！

举个例子：

OpenFlow 1.0 的时候有12个字段，这些字段分别就是我们熟悉的，IP地址，MAC地址，等等。但是很快发现，单单这12个字段不能满足现实网络世界中各种需求（在网络中的协议有很多种）。所以到OpenFlow1.3的时候字段增加到40个，现在OpenFlow1.5甚至更多。

这样带来的麻烦有很多，一是匹配效率和空间占用的问题。二是特定的OpenFlow交换机生产出来后，无法支持新的协议字段，只能在现有协议上进行开发。最终只能面临淘汰。

如果我们可以自定义协议字段的类型，甚至实现自定义动作的类型，那么我们就不需要反复修正协议本身，SDN的架构也将更加灵活。这个自定义协议字段类型，自定义动作类型就是我们所说的数据面编程。

数据面编程思想

数据面编程就是我们自己定义匹配字段，自己定义动作类型，从而自己定义流表，进而形成流水线（pipline）。基于这种初衷，P4应运而生。

什么是P4

P4(Programming Protocol-Independent Packet Processors)是一种数据面的高级编程语言。他可以克服OpenFlow的局限。通过P4语言，我们可以定义我们想要的数据面。进而再通过南向协议添加流表项。

P4 与 OpenFlow 的关联与区别

P4虽然弥补了OpenFlow的不足，但是P4和OpenFlow的定位是截然不同的！ OpenFlow提供了一种控制器和数据面的动态交互的协议。是一种南向协议。而P4只是一个数据面的编程语言。

通过P4，我们可以定义各种各样形状的积木，而通过南向协议，我们可以组装这些积木来实现特定的功能。也就是说，写好P4代码并不是全部，我们还需要写相应的控制面代码才能使网络正常工作。

与OpenFlow对应的是P4 Runtime。还记的上面的那张图吗，为了实现协议无关。P4的设计者们还提供了一个南向协议——P4 runtime。 P4 runtime与OpenFlow功能类似，但是P4 runtime可以充分利用P4协议无关的特性，”与P4更搭配！“。

P4中的那些事

P4是一种高级数据面编程语言，既然是高级语言，那么其设计本身就有着很高的抽象程度。我们先来看一种图：

这是P4中提供的最简单最易理解的编程结构，V1Model。可以看到它由5个模块组成，他们的名字分别是(从左到右)：

Parser: 解析器，解析并且提取数据包头的各个字段。
Ingress： Ingress处理，在这里定义Ingress流水线。
TM： Traffic manager，有一些队列，用于流量控制（一些队列相关的metadata在此更新）。
Egress： Egress, 在这里定义Egress流水线。
Deparser：用于重组数据包，因为数据包在处理过程中经历了分解和处理。所以最后转发的时候需要重组一下。

P4为我们提供了上述抽象，我们就可以把所有的交换机理解为上述的模型，然后按照上述模型进行开发就可以了。所以，按照上述模型，P4语言的代码结构通常为这样:

#include<core.p4>;
#include<v1model.p4>;

/*数据格式定义部分*/
header ethernet_t{
    bit<48>  dst_addr;  //根据各个字段的长度等信息，定义各种数据包头。
    bit<48> src_addr;
    bit<16> ether_type;
}
//.....其他包头格式和 metadata格式定义

/*Parser部分*/
parser MyParser(packet_in packet,
                out headers hdr,
                inout metadata meta,
                inout standard_metadata_t standard_metadata) {
	state start {
        transition parse_ethernet;  //转移到 parse_ethernet状态
    }
    state parse_ethernet {
        packet.extract(hdr.ethernet);   //提起数据包头
        transition select(hdr.ethernet.etherType) { 
            TYPE_MYTUNNEL: parse_myTunnel;
            TYPE_IPV4: parse_ipv4;
            default: accept; //根据 etherType, 选择性的转移到其他状态，知道转移到accept;
        }
        // other state
    }
}

/*Checksum计算可以空着*/
control MyVerifyChecksum(inout headers hdr, inout metadata meta) {   
    apply {  }
}

/*Ingress 处理*/
control MyIngress(inout headers hdr,
                  inout metadata meta,
                  inout standard_metadata_t standard_metadata) {
    action some_action() {
        //一些动作，如修改包头，或者丢弃等等。
    }
    table ipv4_lpm {//定义一张表
        key = {
            hdr.ipv4.dstAddr: lpm;//要匹配的动作和匹配模式（lpm是最长前缀匹配，exact是精准匹配）
        }
        actions = {  //定义控制平面添加流表项时，可选的动作。
            ipv4_forward; 
            drop;
            NoAction;
        }
        size = 1024; //定义大小
        default_action = drop();  //定义默认的动作。
    }

    apply {  //上面只是一些定义，真正的数据包处理逻辑在这里。
        //不用管这里if中具体的条件
        //先主要了解 apply 里面时让我们根据一些逻辑条件，定义数据包再流表之间的处理过程。
        if (hdr.ipv4.isValid() &amp;&amp; !hdr.myTunnel.isValid()) {
            ipv4_lpm.apply();
        }
        if (hdr.myTunnel.isValid()) {
            myTunnel_exact.apply();
        }
    }
}

/*与Ingress处理过程类似*/
control MyEgress(inout headers hdr,
                 inout metadata meta,
                 inout standard_metadata_t standard_metadata) {
    apply {  }
}

/*输出的校验和检验*/
control MyComputeChecksum(inout headers  hdr, inout metadata meta) {
     apply {}
}

/*Deparser 数据包重组*/
control MyDeparser(packet_out packet, in headers hdr) {
    apply {
        packet.emit(hdr.ethernet);
        packet.emit(hdr.ipv4);
        // other emit
    }
}

/*将上述代码中定义的各个模块组装起来，有点像C/C++中的main函数*/
V1Switch(
MyParser(),
MyVerifyChecksum(),
MyIngress(),
MyEgress(),
MyComputeChecksum(),
MyDeparser()
) main;

在开始搭建环境和写P4代码前

p4 的github仓库是学习P4编程的重要基地，我们着重了解一下几个子仓库:

behavioral-model简称BMv2. 是一款支持P4的软件交换机。其设计初衷是完全支持P4语言，从而用于功能性试验和学习，而性能不是第一目标（与OVS不同）。BMv2可以和Mininet集成。BMv2提供两种控制接口，一种是基于thirft的CLI接口（命令行），另一种是基于gRPC和protobuf的P4 runtime。显然，一种是分布式控制平面，一种是集中式控制平面。
tutorials是我们学习P4编程最重要的教程。里面含有一些交互式的学习材料和一个搭建好环境的虚拟机。建议大家使用搭建好环境的虚拟机学习，本人尝试过自己搭建环境，尽管最后成功了，但是中间遇到了各种报错，特别还有国内网络原因，访问github特别慢，整体搭建好还是是比较吃力的。可以直接访问我的ftp服务器下载虚拟机镜像。
p4c是P4的编译器，它是一个比较综合的编译器，支持多个版本的p4代码，同时支持多种输出格式。有二进制形式的，也有用于BMv2的json格式。

上述几个仓库是学习过程中需要用到的，当然还有一些其他仓库，以后再介绍。

本文转自SDNLAB： https://www.sdnlab.com/22466.html

人生亦逝

关注

1
点赞
踩
17

收藏

觉得还不错? 一键收藏
1
评论
P4编程理论与实践——理论篇(转载)

P4编程理论与实践——理论篇由于对SDN充满着兴趣，在学习了一段时间OpenFlow之后，一次偶然的机会接触到了P4。P4可以实现很多新的Idea，但是无奈于国内的实践资料太少了（有些资料似乎比较陈旧了）。唯一的学习来源是官网的英文实例教程，但是摸索起来很费时间。因此本人打算把自己的探索经验，写成一个专题，和大家分享，学习，交流。着重点是实践而非理论，有不正确的地方欢迎批评指正。为什么要从理论上开始介绍呢？因为有了一些基础的理论概念，才能更好的去编程，不会摸不着头脑。无论大家对SDN的理解如何，我觉得
复制链接

扫一扫