浅谈路由器性能提升

最新推荐文章于 2024-07-17 20:34:20 发布

scscat

最新推荐文章于 2024-07-17 20:34:20 发布

阅读量486

点赞数

文章标签：路由器性能优化 cache 平台算法思科

本文链接：https://blog.csdn.net/scscat/article/details/6163846

版权

      在路由器产品的血拼中，最火的莫过于转发性能。基于此，思科开发了名为CEF的快速转发平台，国内各大厂商也迅速跟进，各自开发了自己的快转平台，冠以XEF的名称。虽然各家名字相近，但实际性能却有较大的差别。性能指标通常以kpps来衡量，分为空转性能和负载性能。个人认为，对转发平台性能的评价要以负载性能，甚至是满载性能作为评价标准。优秀的转发平台在满载时应几乎没有性能损失，据我所知，RJ在这方面做得不错。

      要使转发平台达到以上所说的优秀，个人觉得可以在两方面入手：1. 构建好的转发架构；2. 针对具体硬件做相应的性能优化。其中好的架构是关键所在。

      构建好的转发架构。好的架构包括各种优秀的快转算法，高效的同步互斥机制，可量化的进程调度等。在这些因素中，我最感兴趣的是可量化的进程调度。试想，在一个系统中，如果在任何情况下都能保证有70%的CPU时间在处理快速转发，那要达到在满载时没有性能损失似乎也不是什么困难的事情。怎样才能使快转运行时间得到保证呢？个人觉得分组优先级的策略可以借鉴，其基本思路是：比如将所有进程分为A, B两组，每组各有3个进程，以A0 - A2，B0 - B2来表示，其中A组的运行时间需要得到保证。那调度时可以按A0->A1->A2->B0->A0->A1->A2->B1->A0->A1->A2->B2->A0->A1->A2的方式来进行调度。结合到路由器平台的实现中，A组中包括的可以是快转相关的进程，B组中包括的为设备管理（负载）相关的进程。基本的调度策略可以采用优先级加时间片的方式，可以不设计抢占，两组的时间片根据需要也可以设计得不同。

      针对具体硬件的性能优化。此处，讨论的范畴限定在通用处理器范围内，像NP这类高深的东西不去说它。个人觉得硬件对性能的影响来讲，主要集中在内存的访问上面。通过简单的计算很容易得出内存瓶颈这个结论。解决方法是要充分的运用cache，尽量减少cache miss的次数，从而尽量减少访问内存的次数。一个具体的实例是，曾经有一款使用PPC CPU的路由器，FCC使用DMA来更新数据，为了保证CPU访问到数据的正确性，FCC驱动每次更新后都要做cache_invalid的操作，这就导致了每次收发包都要访问内存，性能极低。解决方法是使用CPU的cache一致性功能，去除cache_invalid的动作，这样处理后性能有了很大的提升。除内存访问的优化外，还可以充分利用CPU提供的特殊指令来提升性能。比如，有的CPU提供CRC32这样的指令，使用这类指令来实现CRC算法，运行速度会提高很多。

      个人粗浅的见解，抛砖引玉。