算法面试之生成模型解码策略与评估方法 1.生成模型 1.1 seq2seq 1.2 预训练语言模型 2.解码策略 2.1 greedy decoding 2.2 sampling-based decoding 2.3 top-k/p sampling 3.评估方法 3.1 BLUE 3.2 distinct 3.3 PPL 困惑度 1.生成模型 1.1 seq2seq 1.2 预训练语言模型 prefix LM:对上文双向注意力;下文从左到右生成 2.解码策略 2.1 greedy decoding 很容易选到一些常见词 2.2 sampling-based decoding 可能生成不太相关的回复 2.3 top-k/p sampling