我们在项目中发现一个问题。
项目组成是3个模块(进程):A,B,C。A 与 B 保持 tcp 连接,有需要时,A 向 B 发送控制指令,B 会 启动 C进程。
在这个过程中,B 是服务端,B 收到指令后使用 `execv()` 启动 C。
当我们杀死 B 进程后,A 与 B 的连接并未断开(现象为 A 与 B 连接的 fd 仍显示为 ESTABLISHED 状态)。我们的预期是 A 会报错,但现在连接并未断开,自然也没有报错。
究其原因,B 启动 C 后,C 接管 B 的上下文(通俗来说),包括 B 与 A 的连接。所以我们后来发现,A 与 B 的连接变成了 A 与 C 的连接。
要解决这个问题,我们首先想到 B 进程被杀死时应该关闭与 A 的连接,但结果并不符合按预期。所以 B 进程在 accept A 的连接时,需要给 fd 设置一个属性。
fcntl(fd, F_SETFD, FD_CLOEXEC)
使得当前进程 execv 一个子进程时,已打开的文件描述符能自动关闭。