流畅chatbot采样
1. introduction
这篇博客可以作为chatbot旅程的终点了,前面已经介绍了模型相关的工作,那么做完模型训练以后,剩下的就是生成了。要注意的是,模型生成的内容并不是和训练过程类似的,要想生成流畅且通顺的response还是需要一些额外的处理,这里会介绍一些生成相关的工作,以便让自己训练的模型有用武之地,毕竟,辛辛苦苦做出来的东西,能用且可用才是最让自己有成就感的。
2. 生成方法
2.1 greedy search
每次预测的时候选择概率最大的那个token,最简单,不过效果比较差。
采样公式:
w t = a r g m a x w P ( w ∣ w 1 : t − 1 ) 时 间 步 t 采 样 w_{t}=argmax_{w}P(w|w_{1:t-1}) \quad 时间步t采样 wt=argmaxwP(w∣w1:t−1)时间步