pytorch-知识点笔记2-文本预处理/语言模型/rnn

最新推荐文章于 2024-07-10 22:17:05 发布

k1125403307

最新推荐文章于 2024-07-10 22:17:05 发布

阅读量346

点赞数

分类专栏： pytorch 文章标签：深度学习 python 神经网络

本文链接：https://blog.csdn.net/k1125403307/article/details/104309957

版权

本文记录学习下面三个任务过程中思考过的问题及大家讨论过程中学习到的知识点，欢迎指正。

文本预处理
语言模型
rnn

基础知识部分直接参考Dive-into-DL-PyTorch

ngram的缺点以及如何解决

gram模型的缺点：
参数系数，参数空间过大，存储和内存吃不消
参数空间过大
数据稀疏
但如何解决上述问题，只需要加入平滑方法，如
Additive smoothing
Good-Turing estimate
Jelinek-Mercer smoothing (interpolation)
Katz smoothing (backoff)
Witten-Bell smoothing
Absolute discounting
Kneser-Ney smoothing （常用）
具体细节可以参考 Speech and Language Processing

如何可视化理解序列模型的采样

在这里插入图片描述
原文
比如给定训练数据[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]，批量大小为batch_size=2，时间步数为2，则resize成[0, 1, 2, 3, 4]和[5, 6, 7, 8, 9]，则第一个batch为[[0, 1],[5, 6]]；第二个batch为[[2, 3],[7, 8]]
所以便很好代码逻辑

def data_iter_consecutive(corpus_indices, batch_size, num_steps, device=None):
    if device is None:
        device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    corpus_len = len

最低0.47元/天解锁文章

k1125403307

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pytorch-知识点笔记2-文本预处理/语言模型/rnn

本文记录学习下面三个任务过程中思考过的问题及大家讨论过程中学习到的知识点，欢迎指正。文本预处理语言模型rnn基础知识部分直接参考Dive-into-DL-PyTorchngram的缺点以及如何解决gram模型的缺点：参数系数，参数空间过大，存储和内存吃不消参数空间过大数据稀疏但如何解决上述问题，只需要加入平滑方法，如Additive smoothingGood-Turi...
复制链接

扫一扫