【NLP】n-gram LM & NN LM

最新推荐文章于 2024-06-27 00:19:02 发布

maershii

最新推荐文章于 2024-06-27 00:19:02 发布

阅读量1.5k

点赞数 1

分类专栏： NLP 文章标签： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013166817/article/details/85857543

版权

本文介绍了n-gram语言模型，包括任务描述、模型结构和优化技巧，如平滑处理。还探讨了神经网络语言模型（NN LM）的优势，如避免统计信息需求和内建平滑。最后提到了评估语言模型的Word Error Rate。

摘要由CSDN通过智能技术生成

文章目录

n-gram LM
NN LM
Word Error Rate

n-gram LM

语言模型是生成模型，是一个泛泛的概念，通俗来讲，就是给定一句话的前半部分，预测生成剩余的部分。这里主要介绍一个简单的LM方法，n-gram。

任务描述

输入一个句子的开头单词：比如 I；

输出最有可能生成的完整的句子，比如：I love NLP.

假设S代表了整个句子，包含单词W1,W2,…，则我们的目标是逐个单词生成句子，使得最后的句子的概率P(S)最大。根据极大似然估计：

$max P(S) = \max P(W_1,W_2,...,W_N)= \max P(W_1)P(W_2|W_1)P(W_3|W_1,W_2)...P(W_N|W_1,...,W_{N-1})$

模型结构

n-gram模型假设当前生成的单词只与其前面的n-1个单词有关，即：

$\text{Bigram/2-gram: } P(W_1,W_2,...,W_N) = \prod_{i=2}^N P(W_i|W_{i-1})$

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【NLP】n-gram LM & NN LM

文章目录1. HMM 时序模型任务描述贝叶斯转换求解问题2. n-gram 语言模型任务描述求解问题TricksSmoothingGreedy Search vs Beam SearchLog化乘为加seq2seq 是 sequence to sequence 的缩写，直白的解释是：给定一个模型，输入一个序列，然后模型会预测输出一个序列。那么如何得到预测呢（或者说我们预测的目标是什么）？，当然是...
复制链接

扫一扫

专栏目录

maershii CSDN认证博客专家 CSDN认证企业博客

码龄11年

39: 原创

18万+: 周排名

118万+: 总排名

13万+: 访问

: 等级

1423: 积分

25: 粉丝

56: 获赞

10: 评论

406: 收藏

私信

关注

热门文章

分类专栏

python 1篇
lintcode 1篇
github 1篇
软件安装与使用 1篇
机器学习 10篇
leetcode 21篇
深度学习 3篇
NLP 2篇

最新评论

【leetcode】输出一个数的所有质数因子
【浅滩】: [code=csharp] #define _CRT_SECURE_NO_WARNINGS 1 #include <stdio.h> int main() { int a, b; b = 2; //输入你要计算的值 scanf("%d", &a); //判断大于1,1没有质因数 while (a>1) { //判断b是否是a的因数，是就进入循环，否就判断下一个自然数 if (a % b == 0) { //将值分解成质数相乘的式子如：12 = 2*2*3 //将确定是因数的值不断循环除尽然后输出 //偶数中只有2是质数，且是所有数中最小的质数 while (a % b == 0) { //循环将确定是因数的值不断除尽 a = a / b; } //输出确定的因数 printf("%d\n", b); } else { //判断不是因数，就跳过判断下一个 b++; } } return 0; } [/code]
【机器学习】朴素贝叶斯基本介绍+代码实现
qq_40902046: 上面的正则表达式写错了吧
【机器学习】线性回归+代码实现
wangkai12123: 想要数据集
【leetcode】输出一个数的所有质数因子
飞鱼9372: 判断n%i == 0以后没有给n重新赋值，造成while死循环[code=python] def findPrime(n): if n <= 1: return i = 2 res = [] while n > 1: if n%i == 0: n = n/i res.append(i) else: i+=1 return res [/code]
【机器学习】线性回归+代码实现
qq_44686396: 找不到你的feliname文件

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。