动手深度学习笔记(四十七)8.3. 语言模型和数据集 8.3. 语言模型和数据集 8.3.1. 学习语言模型 8.3.2. 马尔可夫模型与 n n n元语法 8.3.3. 自然语言统计 8.3.4. 读取长序列数据 8.3.4.1. 随机采样 8.3.4.2. 顺序分区 8.3.5. 小结 8.3.6. 练习 8.3. 语言模型和数据集 在 8.2节中, 我们了解了如何将文本数据映射为词元, 以及将这些词元可以视为一系列离散的观测,例如单词或字符。 假设长度为 T T T的文本序列中的词元依次为 x