原文首发在wx公众号上:
生成模型一直是我认为的非常有意思的东西,记得以前同事搞过一个生成藏头诗的模型,可以根据输入的名字来生成藏头诗,当时就感觉非常有趣。
前两天又和朋友聊起来生成模型,朋友说他做了个诗词生成的实验,效果还蛮不错的,于是自己也想实验一下试试。
先来看下生成效果,感觉还不错:
1. 训练语料准备
github上有很多整理好的开源的诗词资源,这里选择了 chinese-poetry 这个开源的库,里面的诗词非常多,足以用作生成模型的训练语料了。
json格式的语料,解析起来很方便。其中部分诗词的内容截图如下:
2. 模型设计
模型就使用经典的 sequence to sequence 模型Bi-LSTM+attention。
模型的结构图如下: