自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qjf42的专栏

这个人很懒，什么都没留下

qjf42 CSDN认证博客专家 CSDN认证企业博客

码龄16年

12: 原创

31万+: 周排名

75万+: 总排名

4万+: 访问

: 等级

556: 积分

33: 粉丝

19: 获赞

4: 评论

86: 收藏

私信

关注

热门文章

分类专栏

强化学习 5篇
NLP 2篇
机器学习 4篇

最新评论

N-gram语言模型 & Perplexity & 平滑
baidu_38739567: 您好， back off 这里的α是不是应该是剩余概率除以所有需要用到的上一ngram的p之和呢？再与此次用的上一ngram的P相乘为此次的P，不然的话所有的P相加就超过1了？个人拙见，想跟楼主探讨下。
N-gram语言模型 & Perplexity & 平滑
qjf42 回复 Chase_Ray: 在训练的时候，如果分母（也就是上文 w_{i-n+1},... w{i-1}）不存在，那( w_{i-n+1},... w{i}) 也肯定不存在，所以不用考虑这类情况实际预测的时候，如果预计会出现训练集没有的分母，那在训练时就需要把这类情况考虑进去，加入<unk>，参考https://stats.stackexchange.com/questions/114863/in-kneser-ney-smoothing-how-are-unseen-words-handled
N-gram语言模型 & Perplexity & 平滑
Chase_Ray: 您好，请问如果KneserNey中分母 C(wi-n+1,...,wi) == 0 怎么处理呢，对这个不是很理解
关于词向量的一些理解
super1peng: 您好，最近也再看相关方面的论文，其中有不懂之处想交流一下，方便的话可能给我一下您的联系方式吗

最新文章

强化学习

关注

文章平均质量分 73

关注数：文章数：6 文章阅读量：23523 文章收藏量：60

作者: qjf42

这个作者很懒，什么都没留下…

展开