num_oov = max(torch.max(ext_src_seq - self.vocab_size + 1), 0) 误区解读: ext_src_seq: [batch_size, sequence_len] self.vocab_size: 50000 ext_src_seq - self.vocab_size + 1:这种运算实际上是对ext_src_seq中的每个元素进行加减运算,相当于把self.vocab_size广播成[batch_size, sequence_len]