RPKI时间飞行:追踪管理、控制和数据平面的延迟
在当今互联网中,资源公钥基础设施(RPKI)正逐渐成为互联网服务提供商(ISPs)日常运营的一部分,路由起源验证(ROV)也得到了广泛部署。然而,RPKI变更在数据平面产生影响所需的时间一直是一个备受关注的问题。本文将深入探讨如何测量RPKI系统在管理、控制和数据平面的延迟,以及这些延迟对互联网路由的影响。
1. 引言
互联网的边界网关协议(BGP)是一种广泛使用的域间路由协议,但它在设计之初并未考虑安全性。为了增强BGP的安全性,RPKI应运而生。RPKI是一个基于X.509的系统,通过加密方法来共享地址和路由信息。在RPKI中,证书颁发机构(CAs),主要是区域互联网注册机构(RIRs),向ISPs颁发包含IP前缀列表的资源证书。ISPs使用这些证书创建数字签名的路由起源授权(ROA),以证明特定自治系统(AS)可以通告这些前缀。其他ISPs的路由器可以使用ROA来验证传入的BGP通告,这一过程称为路由起源验证(ROV)。
RPKI的设计初衷是将管理平面与BGP控制平面解耦,并提供冗余数据以进行验证。然而,由于运营商在更新BGP配置之前需要应用和评估RPKI变更,因此RPKI数据的更新和传播时间不可避免地会延迟整体路由操作。目前,IETF规范在RPKI管理平面协议的时间参数方面缺乏明确规定,而BGP路由更新通常在不到一分钟内传播,最多两分钟。我们的研究发现,APNIC的RPKI数据传播平均需要超过25分钟,而由于我们报告的一个漏洞,ARIN和LACNIC的数据传播时间长达五小时,比BGP慢了几个数量级。
这些管理平面的长时间延迟会增加路由操作的反馈循环,增加错误未解决的机会,并延长修复错误所需的时间。例如,