LanguageModel API 语言模型

最新推荐文章于 2024-04-04 22:03:23 发布

eternity668

最新推荐文章于 2024-04-04 22:03:23 发布

阅读量448

点赞数

分类专栏： Sphinx-4 API 文章标签： sphinx 语音识别

Sphinx-4 API 专栏收录该内容

171 篇文章 2 订阅

订阅专栏

<span style="font-size:24px;">public interface LanguageModel extends Configurable
代表了对言一个N（N-Gram）元语模型的一般接口。所有的概率都在log域的。
本接口的属性：
@S4String(defaultValue = ".")
public final static String PROP_LOCATION = "location";属性用来确定语言模型的位置。
@S4Double(defaultValue = 1.0)
public final static String PROP_UNIGRAM_WEIGHT = "unigramWeight";属性确定了单元语言的权重。即the unigram weight。
@S4Integer(defaultValue = -1)
public final static String PROP_MAX_DEPTH = "maxDepth";属性确定了语言模型（getMaxDepth（））调用所记录的最大深度。如果此属性被设置为（-1）（默认）语言模型所报告的模型的隐式的深度。此属性允许一个更深的语言模型被使用。例如：一个3trigram元语言模型能够被当做一个a bigram model（2元）语言模型使用通过设置此属性为2.注意如果此属性被设置成一个比默认（隐式）值大的值，则隐式深度被使用。对于此属性合法的值为1..N和-1 。
@S4Component(type = Dictionary.class)
public final static String PROP_DICTIONARY = "dictionary";属性确定了使用的字典。
public void allocate()；为创建语言模型分配资源。
  public void deallocate()；释放分配给此语言模型的资源。
public void start();在识别之前调用。
  public void stop();识别结束后调用。
public float getProbability(WordSequence wordSequence);获得字列表表示的字序列的n-gram probability（n元语法概率）；输入参数：wordSequence为字序列。返回的是字序列的概率。是在log域的。
public float getSmear(WordSequence wordSequence);为给定的字序列获得Smear term。此方法在LexTreeLinguist中使用。详细请见：LexTreeLinguist的PROP_WANT_UNIGRAM_SMEAR属性。返回的是与输入字序列相关的Smear term。
public Set<String> getVocabulary();返回在此语言模型中的字的集合。此集合是不可改变的。返回的是不可改变的字集合。
public int getMaxDepth();返回的是语言模型的最大深度。
}</span>

eternity668

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
LanguageModel API 语言模型

public interface LanguageModel extends Configurable代表了对言一个N（N-Gram）元语模型的一般接口。所有的概率都在log域的。本接口的属性：@S4String(defaultValue = ".")public final static String PROP_LOCATION = "location";属性用来确定语言模型的位置。@
复制链接

扫一扫

专栏目录