4.1 文本处理与词嵌入
4.1.1 文本处理
一篇文章可以被简单地看作一串单词序列,甚至是一串字符序列。 我们将 解析文本的常见预处理步骤。 这些步骤通常包括: 1.将文本作为字符串加载到内存中。 2.将字符串切分为词元(如单词和字符)。 3.建立一个字典,将拆分的词元映射到数字索引。 4.将文本转换为数字索引序列,方便模型操作。
文本的对齐:
4.1.2 One-hot 编码
4.2 RNN模型
4.2.1 模型介绍
4.2.2 模型实现
4.2.3 误差反传
4.3 LSTM 模型
4.3.1 网络模型
4.3.2模型实现
初始化模型参数:
模型定义:
训练和预测: