![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语言模型
文章平均质量分 73
kevinfight
这个作者很懒,什么都没留下…
展开
-
srilm 阅读文档1
Array.h Array.cc文档作者:jianzhu创立时间:08.08.19--------------------------------------1、基本类-------------------------------------- 这两个文件主要以模板方式定义了一个动态数组(Array)和一个静态数组(StaticArray)。其中静态数组继承自动态数组。 继承结构图(Array.bmp)Array类 该类提供如下函数 a) 构造函数 b) 赋值操作符=函数转载 2011-05-16 11:18:00 · 934 阅读 · 0 评论 -
Ngram折扣平滑算法
<br />本文档翻译自srilm手册ngram-discount.7.html NAMEngram-discount – 这里主要说明srilm中实现的平滑算法 NOTATIONa_z 代表以a为起始词,以z为结束词的ngram,其中_代表0个或多个词p(a_z) 前n-1个词为a_的情况下,第n个词为z的条件概率a_ n元a_z的前n-1个词构成的前缀_z n元a_z的后n-1个词构成的后缀c(a_z) n元a_z在训练语料中出现的次数原创 2011-05-16 11:53:00 · 3442 阅读 · 0 评论 -
srilm 阅读文档15
Discount.cc Discount.h文档作者:rickjin创立时间:08.09.27--------------1、基本类-------------- Discount.h Discount.cc 这两个文件主要实现了最重要的几个平滑算法, 包括 a. Katz smoothing (基于 Good-Turing smoothing) b. Absolute Discounting c. Natural law of succession [Eric Sven Rista原创 2011-05-16 11:50:00 · 3859 阅读 · 0 评论 -
srilm 阅读文档14
<br /><br />NgramStats.h NgramStats.cc<br />文档作者:jianzhu<br />创立时间:08.09.18<br />--------------------------------------<br />1、概述<br />--------------------------------------<br /> 这两个文件主要实现了统计ngram的相关函数和功能,同时定义了<br />将统计好的ngram以文本方式和二进制方式输出到文件和从文件中读出<br原创 2011-05-16 11:48:00 · 849 阅读 · 0 评论 -
srilm 阅读文档13
<br />TextStats.h TextStats.cc<br />文档作者:jianzhu<br />创立时间:08.09.11--------------------------------------<br />1、概述<br />--------------------------------------<br /> 这两个文件定义了一个TextStats类,该类主要用于计算句子集<br />的perplexity值。TextStats类<br /> 该类提供了如下函数<br />原创 2011-05-16 11:47:00 · 578 阅读 · 0 评论 -
srilm 阅读文档12
<br /><br />LM.h LM.cc<br />文档作者:jianzhu<br />创立时间:08.10.03<br />--------------------------------------<br />1、概述<br />--------------------------------------<br /> 这两个文件定义了语言模型的最基本的接口和一些通用<br />的功能。<br /> LM类<br /> 该类实现了语言模型的基本接口和一些通用功能<br /> 该类提供原创 2011-05-16 11:45:00 · 1122 阅读 · 0 评论 -
srilm 阅读文档11
<br />LMStats.h LMStats.cc<br />文档作者:jianzhu<br />创立时间:08.09.18--------------------------------------<br />1、概述<br />--------------------------------------<br /> 这两个文件主要定义了语言模型中用于对句子,文本<br />和词的统计分析的接口。<br />LMStats类<br /> 该类提供了如下函数<br /> a) 构造函数<原创 2011-05-16 11:44:00 · 555 阅读 · 0 评论 -
srilm 阅读文档10
<br /><br />Vocab.h Vocab.cc<br />文档作者:rickjin<br />创立时间:08.09.10<br />--------------<br />1、基本类<br />--------------<br /> Vocab.h Vocab.cc 这两个文件主要提供了一个Vocab 类用于存储语料中出现的<br /> 单词, 实现一个单词(VocabString)与其对应的索引(VocabIndex)之间的快捷<br /> 映射。在语言模型(LM)中需要表示原创 2011-05-16 11:44:00 · 688 阅读 · 0 评论 -
srilm 阅读文档9
<br /><br />Prob.h Prob.cc<br />文档作者:jianzhu<br />创立时间:08.09.11<br />--------------------------------------<br />1、概述<br />--------------------------------------<br /> 这两个文件定义了一组函数用于处理浮点数和对数的加减操作。<br />同时定义一个用于将字符串浮点数转换为浮点数的函数。<br />--------------------原创 2011-05-16 11:43:00 · 548 阅读 · 0 评论 -
srilm 阅读文档8
<br />Count.h Count.cc<br />文档作者:jianzhu<br />创立时间:08.09.10--------------------------------------<br />1、概述<br />--------------------------------------<br /> 这两个文件主要定义了一组将字符串转换为整数或将整数转化为字符串的函数。<br />同时定义了一组用于读写整数和浮点数的函数。----------------------------------原创 2011-05-16 11:42:00 · 437 阅读 · 0 评论 -
srilm 阅读文档7
<br />XCount.h XCount.cc<br />文档作者:jianzhu<br />创立时间:08.09.08<br />--------------------------------------<br />1、基本类<br />--------------------------------------<br /> 这两个文件定义了一个用于保存和管理次数(频数)的数据结构,该文件定义的<br />XCount类用于保存频数,当该频数的值小或等于unsigned short(or unsi原创 2011-05-16 11:41:00 · 369 阅读 · 0 评论 -
srilm 阅读文档6
<br />IntervalHeap.h IntervalHeap.cc<br />文档作者:jianzhu<br />创立时间:08.08.30<br />--------------------------------------<br />1、基本类<br />-------------------------------------- <br /> 这两个文件主要以模板方式定义了一个区间堆(IntervalHeap)。<br />该区间堆是一个最大值堆和最小值堆的结合。通过在堆的每个节点<br原创 2011-05-16 11:40:00 · 444 阅读 · 0 评论 -
srilm 阅读文档5
<br />Trie.h Trie.cc LHashTrie.cc SArrayTrie.cc<br />文档作者:rickjin<br />创立时间:08.08.24--------------<br />1、基本类<br />--------------<br /> Trie.h Trie.cc 这两个文件主要以模板方式实现了一个常用Trie 结构, Trie<KeyT,<br /> DataT> 可以当作是 Map 的扩展, 把一个 KeyT 的序列 (KeyT *) 映射到数据.原创 2011-05-16 11:39:00 · 482 阅读 · 0 评论 -
srilm 阅读文档4
<br />LHash.h LHash.cc<br />文档作者:jianzhu<br />创立时间:08.08.23<br />--------------------------------------<br />1、基本类<br />-------------------------------------- <br /> 这两个文件主要以模板方式定义了三个类:哈希体(LHashBody)、哈希(LHash),<br />以及哈希迭代器(LHashIter)类。这三个类符合映射类型的接口方式。<原创 2011-05-16 11:38:00 · 549 阅读 · 0 评论 -
srilm 阅读文档3
<br />Map.h Map.cc<br />文档作者: jianzhu<br />创立时间:08.08.23--------------------------------------<br />1、基本类<br />-------------------------------------- 这两个文件主要以模板方式定义了一个映射类型(Map)的容器,该容器由三个类<br />_Map、MapEntry、Map刻画。同时定义了用于键初始化和判读键是否存在的函数。<br /> 继承结构图(M原创 2011-05-16 11:36:00 · 515 阅读 · 0 评论 -
srilm 阅读文档2
<br />SArray.cc SArray.h<br />文档作者:rickjin<br />创立时间:08.08.24--------------<br />1、基本类<br />--------------SArray.cc SArray.h 两个文件主要是以模板方式实现了一个排序数组 SArray, 一共包含<br />三个类 : SArrayBody, SArray, SArrayIter 1) SArray<KeyT, DataT> 是一个从 KeyT 映射到 DataT 的 Map 类型原创 2011-05-16 11:36:00 · 459 阅读 · 0 评论 -
SRILM 阅读文档原文地址
http://blogold.chinaunix.net/u1/58264/article_96731.html原创 2011-05-16 11:54:00 · 641 阅读 · 0 评论