双机热备及集群软件在集群节点间保持着间歇的通信信号,也叫做心跳信号,是错误检测的一个机制。即通过每一个通信路径,周期性的检测各个节点的状态(包括系统的状态和应用的状态),如果连续没有收到的心跳信号到了一定的数目,双机热备及集群软件就将认为相应的系统已经出现故障。
 传统上心跳故障检测使用串口通讯的方式。但目前已经普遍使用基于TCP/IP的方式。两台服务器之间,可以使用直连网线。也可以将两台或多台服务器用于心跳诊断的网卡通过交换机连接,组成一个私网。