语言模型srilm（二） prune剪枝

最新推荐文章于 2023-10-26 18:13:35 发布

过得很好梵蒂冈

最新推荐文章于 2023-10-26 18:13:35 发布

阅读量914

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44944990/article/details/89481422

版权

为了减小N-gram语言模型的大小并保持性能，文章介绍了SRILM中采用的基于相对熵的剪枝方法。剪枝策略需满足soundness、efficiency和self-containedness原则。剪枝过程涉及删除ngram并重新计算回退概率，通过最小化剪枝前后模型的概率分布距离（相对熵或KL距离）来评估性能变化。

摘要由CSDN通过智能技术生成

为什么引入剪枝

传统的N-gram backoff模型，提升性能的两条主要路径是增加阶数和增加语料，两者带来的共同副作用是增加了模型的大小，进而增加了语音识别解码器的内存占用。为了减少模型的大小，同时保证性能最大化，引入了prune。
为了实现剪枝选取的准则需要满足以下三个条件：

soundness
The criterion should optimize some wellunderstood information-theoretic measure of language
model quality.
efficiency
高效、快速
self-containedness
从实用性角度考虑，只有当前的语言模型可用，没有其他多余的信息可用

srilm采用了基于相对熵的剪枝方法（N-gram pruning based on relative entropy）。

基于相对熵的剪枝

剪枝的主要目的是为了删除已有ngram，同时保证未删除的ngram不变，还需要重新计算回退概率。
那么怎么样衡量剪枝以后语言模型性能的改变呢？
一个想法就是去最小化剪枝前后两个模型之间概率分布的距离。自然的，我们会选择相对熵或者KL距离，定义参考链接:

D (p

最低0.47元/天解锁文章

过得很好梵蒂冈

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
语言模型srilm（二） prune剪枝

语言模型srilm（二） prune剪枝
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。