语言模型训练工具SRILM详解

最新推荐文章于 2023-08-27 23:19:15 发布

beck_zhou

最新推荐文章于 2023-08-27 23:19:15 发布

阅读量1.1w

点赞数 5

分类专栏：算法研究(数据挖掘、机器学习、自然语言、深度学习、搜索引擎) 转型——创业/经济/金融/投资/理财

本文链接：https://blog.csdn.net/zhoubl668/article/details/8365716

版权

本文介绍了SRILM工具在语言模型训练中的应用，包括1-gram、2-gram和3-gram的统计分析，并展示了如何使用SRILM计算测试集的困惑度。通过给出的示例，展示了评估过程和相关参数。此外，还推荐了相关书籍和文献，帮助读者深入理解和学习语言模型。

摘要由CSDN通过智能技术生成

SRILM是著名的约翰霍普金斯夏季研讨会（Johns Hopkins Summer Workshop）的产物，诞生于1995年，由SRI实验室的Andreas Stolcke负责开发维护。
关于SRILM的安装，我已经在前面关于moses平台搭建的文章（参见：《Moses相关介绍》和《Ubuntu8.10下moses测试平台搭建全记录》）中介绍过了，这里就不再重复。准确的说，SRILM并不是因机器翻译而诞生的，它主要是为语音识别所开发的，全称为Stanford Research Institute Language Modeling Toolkit。事实上统计机器翻译与语音识别关系千丝万缕，我会在以后的文章中介绍。
SRILM用来构建和应用统计语言模型，主要用于语音识别，统计标注和切分，以及机器翻译，可运行在UNIX及Windows平台上。它主要包含以下几个部分：
• 一组实现的语言模型、支持这些模型的数据结构和各种有用的函数的C++类库；
• 一组建立在这些类库基础上的用于执行标准任务的可执行程序，如训练语言模型，在数据集上对这些语言模型进行测试，对文本进行标注或切分等任务。
• 一组使相关任务变得容易的各种脚本。
SRILM的主要目标是支持语言模型的估计和评测。估计是从训练数据（训练集）中得到一个模型，包括最大似然估计及相应的平滑算法；而评测则是从测试集中计算其困惑度（MIT自然语言处理概率语言模型有相关介绍）。其最基础和最核心的模块是n-gram模块，这也是最早实现的模块，包括两个工具࿱

最低0.47元/天解锁文章

beck_zhou

关注

5
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
语言模型训练工具SRILM详解

SRILM是著名的约翰霍普金斯夏季研讨会（Johns Hopkins Summer Workshop）的产物，诞生于1995年，由SRI实验室的Andreas Stolcke负责开发维护。关于SRILM的安装，我已经在前面关于moses平台搭建的文章（参见：《Moses相关介绍》和《Ubuntu8.10下moses测试平台搭建全记录》）中介绍过了，这里就不再重复。准确的说，SRILM并不
复制链接

扫一扫

专栏目录