一、零拷贝
1、Netty的接收和发送消息,均使用堆外直接内存进行Socket的读写,不需要进行字节缓冲的二次拷贝。
2、Netty提供了组合Buffer对象,可以聚合多个ByteBuffer对象。用户可以像操作一个Buffer那样方便地对组合Buffer进行操作。避免了传统通过内存拷贝的方式将几个小的Buffer合并成一个大的Buffer。
3、Netty的文件传输采用了transferTo方法,它可以直接将文件缓冲区的数据发送到目标Channel,避免了传统通过循环write方式导致的内存拷贝问题。
二、内存池
随着JVM虚拟机和JIT即时编译技术的发展,对象的分配和回收是个非常轻量级的工作。但是对于缓冲区Buffer,情况不同,特别是对于堆外直接内存的分配和回收。Netty提供了基于内存池的缓冲区“重用”机制。采用这种内存池的ByteBuf相比于每次都创建的ByteBuf性能提升23倍左右。
三、无锁化的串行设计
在大多数场景下,并行多线程处理可以提升系统的并发性能。但是处理不当,容易出现“锁竞争”,严重影响性能。为了避免锁竞争带来的性能损耗,可以通过串行化设计,即消息的处理尽可能在同一个线程内完成,期间不进行线程切换,这样就避免了多线程竞争的同步锁。
而Netty采用了“串行无锁化”设计,在I/O线程内部进行串行操作,避免多线程竞争导致的性能下降。表面上看,串行化设计似乎CPU利用率不高,并发程度不够。但是通过调整NIO线程池的线程参数,可以同时启动多个串行化的线程并行运行,这种局部无锁化的串行线程设计相比一个队列+多个线程模型,性能更优。
四、高效的并发编程
volatile的大量、正确的使用;CAS和原子类的广泛应用;线程安全容量的使用;通过读写锁提升并发性能。