目录
前言
说到「高性能网络编程」,你的脑海里可能会想到:IO 多路复用、事件驱动、Reactor模型 、epoll 等关键字眼,(👀 八九不离十了, 你只需要一篇文章把这些知识点串联起来,往下看就对了。
当然,即使你暂时啥也没想起也没关系,本文致力于梳理高性能网络模型系列文章,帮助你真正吃透高性能网络模型。
从笔者多年实践经验来看,redis 也好、kafka 也罢,只要你想要深入学习其内部原理甚至源码探索,「网络模块」的解决方案是你绕不过的一道坎,换句话说,「高性能网络模型」基本上是每一个框架需要重点考虑的问题。
🚀 网络问题一通则百通,彻底搞懂高性能网络模型之后,市面上开源框架的网络通信模块基本算是过关了,因为各框架网络模块采用的模式大同小异。
总体来说,谈到高性能网络编程,一般会从这几个方面循序渐进讨论:
- 常见的 4 种 IO 模型:(目前最常使用 IO 多路复用,当然,以后可能会是 异步 IO)
- 操作系统对 IO 多路复用实现的几种支持:select、poll、epoll
- 高性能网络编程利器:Reactor 模式
- Reactor 的应用:redis、netty、nginx、kafka、tomcat …
✅ 网络模块主要解决的问题是如何高效的处理网络 IO 数据:
系列文章
一、常见的 4 种 IO 模型
在面试中,经常会问到 IO 模型以及区别,具体来说有 同步
、异步
、阻塞
、非阻塞
四种。其中:
- 同步、异步:指应用程序在与内核通信时,数据从内核空间到应用空间的拷贝,是由内核主动发起还是由应用程序来触发;内核主动发起则是异步,反之为同步。
- 阻塞、非阻塞:指应用程序在发起 I/O 操作时,是立即返回还是等待。
同步阻塞:通常是用户态线程通过系统调用阻塞读取网卡传递的数据,我们知道,在 TCP 三次握手建立连接之后,真正等待数据的到来需要一定时间;
这个时候,在该模式下用户线程会一直阻塞等待网卡数据准备就绪,直到完成数据读写完成;可以看到,用户线程大部分都在等待 IO 事件就绪,造成资源的急剧浪费。
同步非阻塞 :与阻塞 IO 相反,如果数据未就绪会直接返回,应用层轮询读取/查询,直到成功读取数据。
I/O多路复用: 先查询 IO 事件是否准备就绪,当 IO 事件准备就绪了,则会真正的通过系统调用实现数据读写;
查询操作,不管是否数据准备就绪都会立即返回,即非阻塞;因此,通常情况下,会通过轮训来不断监听 IO 事件是否准备就绪;因为操作是非阻塞的,这个过程中通常只需及少量线程(一般一个线程即可)来处理这个轮训操作,极大的解决阻塞模式下 IO 枯竭问题。
这种一个线程就可以监听所有网络连接的 IO 事件是否准备就绪的模式,就是大名鼎鼎的IO多路复用
。
异步IO: 用户线程发起 read 调用的同时注册一个回调函数,read 立即返回,等内核将数据准备好后,再调用指定的回调函数完成处理,在这个过程中,用户线程一直没有阻塞。
敲黑板!!! ,IO 模型是网络编程中基础,需要重点掌握。
二、select、poll、epoll
IO 多路复用是我们经常听到的、与高性能网络编程相关的词汇。
你可能不知道的是,IO 多路复用也需要系统内核的支持,比如 Windows、Max、Linux 支持方式有些差别。
重点掌握!!!
三、Reactor 网络模型
目前高性能网络编程最流行的模式,本质借助于事件驱动
+ IO 多路复用
重点掌握!!!
四、Reactor 应用
1. Tomcat 网络模型
2. Redis 网络模型
3. Kafka 网络模型
Reactor 模式相关应用持续完善中~