Java BIO NIO AIO

2024-12-10

本文的部分内容来自于《Netty 权威指南(第2版)》第一、二章，有兴趣可找原书阅读。

1 Linux 网络 IO 模型

Linux 的内核将所有的外部设备都看作是一个文件来操作，对一个文件进行读写时会调用内核提供的系统命令，然后返回一个 file descriptor（fd，文件描述符），类似的，对一个 socket 读写时也会有相应的描述符，称为 socket fd（socket 描述符）。描述符是一个非负的整数，用于唯一标识 I/O 资源，它指向内核中的一个数据结构（包含文件路径、数据区等一些属性）。

Socket：如果我们想使用 TCP 协议，不可能要求每个程序员都去实现三次握手、丢包重传、滑动窗口等机制，它应该由操作系统负责，没必要重复开发。但对于应用程序来说，操作系统需要抽象出一个概念，让上层应用去编程，所以操作系统提供了抽象接口 Socket，它封装了 TCP/UDP 等协议，位于应用层与传输层之间，开发者使用时无需关注协议细节，仅通过调用 Socket 的标准化接口，即可实现 TCP 或 UDP 通信。它用 IP 地址与端口号的组合唯一标识网络中的通信端点，客户端和服务端的连接通过一对 Socket 实现，是计算机网络中实现端到端通信的核心机制。
Java Socket 接口和操作系统的 Socket‌ 接口不是同一个，Java Socket 通过 JNI 封装了操作系统的 Socket API。

根据 UNIX 网络编程对 I/O 模型的分类，UNIX 提供了 5 种 I/O 模型，但无论是哪一种，实际上都可以分为两个阶段（以 read 操作为例）：
第一阶段：等待内核中的数据准备就绪；
第二阶段：将数据从内核拷贝到用户空间。

那什么是内核空间和用户空间？请看下图：

用户空间：也称为用户态，即上层应用程序的活动空间，应用程序的执行必须依赖于内核提供的资源。
内核空间：也称为内核态，控制计算机的硬件资源，给上层应用程序提供运行环境，是操作系统的核心部分。
注：两者都有自己的数据缓冲区，通常数据会先放到缓冲区。并且用户态可以通过系统调用切换到内核态（比如调用 epoll_create），这是主动进入到内核态。在出现异常或者外围设备中断时进入到内核态，属于被动进入。

而这 5 种 I/O 模型就是根据它在上述两个阶段的不同表现来区分的：根据第一阶段用户进程（或者说用户线程）是否阻塞来区分阻塞 IO / 非阻塞 IO，根据第二阶段用户进程（或者说用户线程）是否阻塞来区分同步 IO / 异步 IO！（注意：每本书的定义可能不一样，不要过分纠结在一些技术术语的咬文嚼字上，知道是怎么一回事就行了）

假设在用户进程中有个调用叫 recvfrom，那么在不同的 IO 模型中，它的执行过程是这样的：

1.1 阻塞 IO

两个阶段都阻塞（BIO）。
换句话说，进程从调用 recvfrom 开始到它返回的整段时间内都是被阻塞的，如下图：

这是最常用的 IO 模型，缺省情况下，所有文件操作都是阻塞的。

1.2 非阻塞 IO

第一阶段不再阻塞，而是用轮询的方式检查数据是否准备好，第二阶段仍然阻塞。
调用 recvfrom 后，如果内核缓冲区中没有数据，那就直接返回一个错误，然后开始轮询，直到有数据到来（在负载均衡中，轮询的含义是将请求按顺序均匀分配给后端服务器；而在非阻塞 IO 中，轮询的含义是主动循环检查 I/O 状态）。

1.3 IO 复用

在调用 recvfrom 之前，用户进程把相应的一个或多个 socket fd 都阻塞在 select / poll 系统调用上（即多个 IO 的阻塞复用了同一个 select 阻塞），select / poll 再将这个 fd 集合传给内核，由内核帮我们遍历这些 fd 是否处于就绪状态，当发现有 fd 就绪时（有数据可读/写），内核就给它做一个标记，然后返回就绪 fd 的数量给用户进程，用户进程通过遍历所有的 fd 找出有标记的 fd，再作相应处理即可。所以，如果用户进程调用了 recvfrom，则说明它的第一阶段其实已经完成，自然不算阻塞，但第二阶段仍然阻塞。

不过，因为 select / poll 是顺序扫描，而且它支持的 fd 数量有限，因此它的使用受到了很大限制，加上每次调用都需将所有 fd 从用户态重新复制到内核态，高频调用时开销很大。所以 Linux 找到了另一个替代方案 epoll，epoll 使用基于事件驱动的方式代替顺序扫描，性能更高，当有 fd 就绪时，立即回调 callback 函数。

与 select 相比，epoll 作了很多重大改进：

一个进程打开的 socket fd 数量不受限制

select 的最大缺陷就是单个进程打开的 fd 数量是有限制的，默认值是 1024，这对于那些需要支持上万个 TCP 连接的大型服务器来说显然太少了。而 epoll 没有这个限制，它仅受限于操作系统的最大文件句柄数，这个值通常跟系统的内存有关。另外，epoll 选择红黑树存储 socket fd，能够快速查找、插入和删除。
IO 效率不会随着 fd 数量的增加而线性下降

在 WAN 环境下，当 socket fd 集合很大时，由于网络延时或链路空闲，任一时刻只有少部分的 socket 是活跃的，但是 select / poll 每次都会线性扫描全部集合，导致效率会线性下降。而 epoll 只对活跃的 socket 进行操作，通过每个 fd 上面的 callback 函数实现，只有活跃的 socket 才会主动调用 callback 函数。
使用 mmap 加速内核与用户空间的消息传递

无论是 select、poll 还是 epoll，都需要把 fd 集合从用户空间复制到内核，如何避免不必要的内存复制就显得非常重要，epoll 是通过内核和用户空间 mmap 同一块内存来实现的。下面简单介绍一下 mmap（知道的可跳过）：

古代的皇帝有很多妃嫔，难免争风吃醋，位高的贵妃仗势欺人，一些小妃嫔无法正面回击，于是就想些别的点子，比如扎小人，方法是：拿布片等物品模拟一个小人出来，在上面画上正主的经脉，写上名字，再施以某种魔法，然后用针扎这个小人的穴道，远程那位正主的相应部位就会受到同样的折磨。虽然有点神乎其技，但在 Linux 的内核开发里，mmap 就拥有这种魔法。

系统调用 mmap（Memory map），即内存映射，简而言之就是将内核空间的一段内存区域映射到用户空间。因为用户空间无法直接操作寄存器的物理地址，于是通过 mmap 进行内存映射，将物理地址映射到用户空间的虚拟地址上，映射成功后，用户通过读写自己手边的虚拟地址，就可以实现对物理地址的读取/写入，反之，内核空间对这段区域的修改也会直接反映到用户空间。

mmap 有诸多用途，比如它可以将内核空间的一段内存区域同时映射到多个用户进程，以此便可以实现进程间的通信；在内核与用户空间之间需要传输大量数据时，使用 mmap 后效率非常高。它是一种零拷贝技术，其 IO 模型如下图所示：
epoll 的 API 更加简单

包括创建一个 epoll 描述符、注册/管理 fd 及其监听的事件、阻塞等待监听的事件发生、关闭 epoll 描述符等等。

Java NIO 的核心类库多路复用器 Selector 就是基于 epoll 的技术实现。要说明的是，在不同的操作系统下，Selector 的实现机制可能不同，比如在 Linux 中会优先使用 epoll 作为 Selector 的底层实现，但在 Windows 中仍然默认使用 select 模型，不过两者在应用层的接口一致，开发者使用时是无感知的。

Selector 的工作方式是通过调用 select() 方法阻塞当前线程，直到内核通知注册的 Channel 中有事件就绪，随后返回就绪事件的数量，通过 selectedKeys() 方法可以获取就绪 Channel 及具体事件类型的集合，就能进行相应的 IO 操作了。在 Linux 下，epoll 优化了传统的 select 实现，所以 Selector 并没有最大连接数的限制，性能也不会线性下降，这意味着只需一个线程负责 Selector，就可接入成千上万的客户端。

1.4 信号驱动 IO

在调用 recvfrom 之前，用户进程通过调用 sigaction 先执行一个信号处理函数（此函数立即返回，用户进程可继续执行，是非阻塞的），当内核中数据准备就绪时，它就为用户进程生成一个信号，通过这个信号来回调通知用户进程可以调用 recvfrom 来读取数据了。此时对于 recvfrom 来说，它的第一阶段其实已经完成，自然不算阻塞，第二阶段仍然阻塞。

1.5 异步 IO

用户进程调用 read 时，两个阶段都不再阻塞（AIO）。相当于用户进程告知内核启动某个操作后，便继续向下执行，不再等待，而内核会在整个操作完成后通知用户进程。异步 IO 和信号驱动 IO 的主要区别是：信号驱动 IO 是内核通知我们何时可以开始一个 IO 操作，而异步 IO 是内核通知我们 IO 操作何时已经完成。

2 在 Java IO 中的应用

经过前文的介绍，可知对于操作系统而言，底层是支持异步 IO 通信的。那么 Java IO 又是如何对此提供支持的呢？

2.1 Java BIO

在 JDK 1.4 推出 Java NIO 之前，所有基于 Java 的 socket 通信都采用了同步阻塞模式（BIO），这种一请求一应答的通信模型简化了上层的应用开发，但是在性能和可靠性方面却存在着巨大的瓶颈。因此，在很长一段时间里，大型应用服务器都用 C 或者 C++ 语言开发，因为它们可以直接使用操作系统提供的异步 IO 的能力。

线程是 JVM 非常宝贵的系统资源，当并发访问量增大、响应时间延迟增大之后，由于服务端的线程个数和客户端并发访问数呈 1：1 的正比关系，线程数的膨胀会让系统性能急剧下降，采用 Java BIO 开发的服务端软件只能通过硬件的不断扩容来满足高并发和低时延，它极大地增加了企业的成本，并且随着集群规模的不断膨胀，系统的可维护性也面临巨大挑战，随时可能发生线程堆栈溢出、无法创建新线程、进程宕机等问题。Java BIO 存在的主要问题如下：

没有数据缓冲区，IO 性能存在问题；
没有 Channel 概念，只有输入和输出流；
通信线程阻塞时间长；
支持的字符集有限。

2.2 Java NIO

在 IO 编程过程中，当需要同时处理多个客户端接入请求时，可以利用多线程或者 IO 多路复用技术进行处理。IO 多路复用技术通过把多个 IO 的阻塞复用到同一个 select 的阻塞上，从而使得系统在单线程的情况下可以同时处理多个客户端请求。与传统的多线程模型相比，IO 多路复用的最大优势是系统开销小，系统不需要创建新的额外线程，也不需要维护这些线程的运行，节省了系统资源，IO 多路复用的主要应用场景如下：

服务器需要同时处理多个处于监听状态或者连接状态的套接字；
服务器需要同时处理多种网络协议的套接字。

Java NIO 的类库提供了：

实现 NIO 操作的多路复用器 Selector，它是 Java NIO 编程的基础，前文有过介绍；
进行异步 IO 操作的缓冲区（比如 ByteBuffer 等），任何时候读写 NIO 中的数据，都是通过缓冲区进行；
进行各种 IO 操作的 Channel（比如用于网络读写的 ServerSocketChannel 和用于文件操作的 FileChannel 等），Stream 流只在一个方向上移动，而 Channel 通道是双向的（全双工），它同时支持读写操作，比流能更好地映射底层操作系统的 API；
进行异步 IO 操作的管道 Pipe，单向传输，基于操作系统管道（内存中的字节流），适用于线程间通信；
多种字符集的编码能力和解码能力。

2.3 Java AIO

或者也可以称为 Java NIO 2.0（对应于 UNIX 网络编程中的事件驱动 IO），它的类库提供了：

提供 AIO 功能，支持基于文件的异步 IO 操作和针对网络套接字的异步操作；
提供了能够批量获取文件属性的 API，这些 API 具有平台无关性；
提供了标准文件系统的 SPI，供各个服务提供商扩展实现；
对配置和多播数据报的支持。

异步通道提供以下两种方式获取操作结果：

通过 java.util.concurrent.Future 类来表示异步操作的结果；
在执行异步操作的时候传入一个 java.nio.channels。

CompletionHandler 接口的实现类作为操作完成的回调。在实际项目中，异步的网络套接字 Channel 是被动执行对象，它不需要像 NIO 编程那样创建一个独立的 IO 线程来处理读写操作，对于 AsynchronousServerSocketChannel 和 AsynchronousSocketChannel，它们都由 JDK 底层的线程池负责回调并驱动读写操作。

☆ 方法的调用有三种方式：

同步调用：最基本且最简单的方式，比如类 A 的方法 a() 直接调用类 B 的方法 b()，a() 要等到 b() 执行完毕后才继续往下走。这种调用方式适用于方法 b() 执行时间不长的情况，因为 b() 方法执行时间一长或者直接阻塞的话，a() 方法的余下代码就无法执行下去，会造成整个流程的阻塞。
异步调用：类 A 的方法 a() 起一个新线程调用类 B 的方法 b()，方法 a() 继续往下执行，不用等待方法 b() 执行完成，这样无论方法 b() 执行多久，都不会阻塞方法 a() 的执行。如果 a() 需要 b() 的异步执行结果，则可以使用类似 Future + Callable 的组合对方法 b() 进行监听。
回调：类 A 的方法 a() 调用了类 B 的方法 b()，方法 b() 执行完毕后主动调用类 A 的 callback() 方法，是一种双向的调用方式。回调函数（callback() 方法）是一个由调用方实现、供被调用方使用的特殊函数，它作为参数传递给被调用方，在特定事件、条件满足或异步操作完成后被被调用方调用。

2.4 三种 Java IO 对比

Java BIO：一个线程处理一个客户端连接（1:1）
Java NIO：一个线程处理多个客户端连接（1:n）
Java AIO：被动回调，不需要启动额外的线程（0:n）

2.5 选择 Netty

实际开发时，为什么不用 JDK NIO 的原生类库，而选择 Netty 框架？

JDK NIO 有本身固有的复杂性和 Bug，开发出高质量的 NIO 程序并不是一件简单的事情。虽然用原生 JDK NIO 开发功能相对容易，但是其可靠性能力补足的工作量和难度都非常大，作为一个服务端，需要能够处理网络的闪断、客户端的重复接入、客户端的安全认证、消息的编解码、半包读写、失败缓存、网络拥塞、异常码流等情况，如果没有足够的编程经验积累，一个稳定的服务端往往需要一年甚至更长的时间。更为糟糕的是，一旦在生产环境发生问题，调试定位难度大，还可能带来巨大损失。

Netty 经历了大规模的商业应用考验，质量得到验证，成熟稳定。比如 Redis 的连接是基于 Netty 的 NIO 模型来管理，还有 Redisson 看门狗中的异步定时任务也是基于 Netty 的 HashedWheelTimer 实现。Netty 的社区活跃，已成为最流行的 NIO 框架之一（什么是框架？框架就像一个模板，里面预置了一些公认的最佳实践，它无法独立运行，必须由开发人员按照它定义的规则，把项目相关代码填充到指定的地方，才是一个完整的应用程序。框架不得不学，但如果只会用框架，只会填充代码也是不行的）。Netty 的核心组件有：

网络通信层：
Bootstrap / ServerBootstrap：负责客户端或服务端的启动引导，串联其他组件初始化流程；
Channel：网络数据传输通道，封装了 Socket，常见实现比如 NioSocketChannel / NioServerSocketChannel。
事件调度层：
‌EventLoopGroup：本质是线程池，服务端通常配置主从两组：bossGroup 处理连接，workerGroup 处理业务；
EventLoop：线程池中的单个线程，每个线程绑定一个多路复用器，负责监听注册在该线程上的所有 Channel 的 I/O 事件（如连接、读写），并执行异步任务；服务端的多路复用器总数为 bossGroup 与 workerGroup 的线程数之和。
服务编排层：
ChannelHandler：核心业务逻辑处理器，分为入站（ChannelInboundHandler，处理接收的数据）和出站（ChannelOutboundHandler，处理发送的数据），如编解码、日志记录等；
ChannelPipeline：使用责任链模式，将多个 ChannelHandler 按顺序链接，（可双向）处理数据流或事件；
ChannelHandlerContext：保存 ChannelHandler 的上下文信息，支持事件传播（如触发下一个 Handler）。
其他关键组件：
ChannelFuture‌：等待异步操作结果，支持回调通知；
ByteBuf‌：高性能字节容器，支持零拷贝、动态扩容，优于 JDK 的 ByteBuffer。
各组件协同工作流程：
**ServerBootstrap 初始化 => Channel 注册到 EventLoop => 事件触发后由 Pipeline 调度 Handler 链式处理**。

2.5.1 粘包和拆包

产生粘包和拆包问题的主要原因是，操作系统在发送 TCP 数据的时候，会先放到缓冲区，例如它的大小为 1024 个字节，如果一次请求发送的数据量比较小，未达到缓冲区的大小，则 TCP 会将多个请求合并为一个请求进行发送，如此便形成了粘包问题；如果一次请求发送的数据量比较大，超过了缓冲区的大小，则 TCP 又会将其拆分为多个小包进行多次发送，这就是拆包问题。

常见的解决方案有三种：
（1）固定每个包的长度，比如将客户端发送的消息长度固定为 1024 个字节，不足则填充空格补齐；
（2）使用特定的分隔符，比如在每条消息的末尾加上 \r\n，接收方就根据数据中的 \r\n 切分或者合并数据；
（3）将一条消息分为头部和消息体，头部包含长度字段（保存头部和消息体的总长度，也可调整为仅保存消息体长度），接收方先读取头部中的长度字段，然后根据其值精确读取字节数得到完整消息体（Netty 的默认方案）。