一、Transformer-BiLSTM网络结构解析 1. 网络拓扑结构 该模型由五部分组成(见图1): 输入层:接收振动信号的时域/频域特征(如峭度、熵值等13种多尺度特征) BiLSTM层:双向处理时序数据,前向LSTM捕获历史信息 $ h_{t-1} $,后向LSTM捕获未来信息 $ h_{t+1} $(图2) 多头注意力层:通过多组Q/K/V矩阵并行计算,权重公式: