神经语言模型_逐段解读

最新推荐文章于 2024-06-20 15:06:38 发布

Neways谭

最新推荐文章于 2024-06-20 15:06:38 发布

阅读量407

点赞数

分类专栏： NLP 文章标签： nlp 自然语言处理

本文链接：https://blog.csdn.net/weixin_46195663/article/details/109671823

版权

本文探讨了神经语言模型如何通过分布词向量解决统计语言模型中的维度灾难问题，避免了n-grams方法的局限性。通过训练，模型能够为未在语料库中出现的上文生成向量表示，提高了模型的泛化能力。实验结果显示，神经语言模型在处理更长的上下文时比n-grams表现更好，并提出了针对未登录词（OOV）的解决方案。

摘要由CSDN通过智能技术生成

原文：Kandola, E. J. , Hofmann, T. , Poggio, T. , & Shawe-Taylor, J. . (2006). A neural probabilistic language model. Studies in Fuzziness & Soft Computing, 194, 137-186.
原文地址A Neural Probabilistic Language Model
关于语言模型n-grams的内容，参见系列博文语言模型：n-grams

摘要

统计语言模型的目的是为了获取序列的联合概率分布，最经典的做法就是基于前文来推断下文。
$P(x_0,x_1,...,x_t) =P(x_0|<start>) \prod_{i=0}^t(x_i|x_{i-1},..,x_0)P(<end>|x_t)$
对于那些未出现在词库中的句子（很显然会出现），这里的条件概率只能是0，导致数据矩阵稀疏，最终会引发维度灾难。
为此，基于马尔可夫假设的n-grams方法提出，只选取部分前文（short lapping，一般n<4)作为变量计算条件概率。

最低0.47元/天解锁文章

Neways谭

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
神经语言模型_逐段解读

神经网络语言模型摘要引言神经模型并行执行实验结果拓展工作OOV待解决的工作结论原文：Kandola, E. J. , Hofmann, T. , Poggio, T. , & Shawe-Taylor, J. . (2006). A neural probabilistic language model. Studies in Fuzziness & Soft Computing, 194, 137-186.原文地址A Neural Probabilistic Language Mode
复制链接

扫一扫

专栏目录