目前循环神经网络(RNN)已经广泛用于自然语言处理中,可以处理大量的序列数据,可以说是最强大的神经网络模型之一。人们已经给 RNN 找到了越来越多的事情做,比如画画和写诗,微软的小冰都已经出版了一本诗集了。
而其实训练一个能写诗的神经网络并不难,下面我们就介绍如何简单快捷地建立一个会写诗的网络模型。
本次开发环境如下:
- Python 3.6
- Keras 环境
- Jupyter Notebook
整个过程分为以下步骤完成:
- 语料准备
- 语料预处理
- 模型参数配置
- 构建模型
- 训练模型
- 模型作诗
- 绘制模型网络结构图
下面一步步来构建和训练一个会写诗的模型。
第一,语料准备。一共四万多首古诗,每行一首诗,标题在预处理的时候已经去掉了。
第二,文件预处理。首先,机器并不懂每个中文汉字代表的是什么,所以要将文字转换为机器能理解的形式,这里我们采用 One-Hot 的形式