LanguageModel API 语言模型

<span style="font-size:24px;">public interface LanguageModel extends Configurable
代表了对言一个N(N-Gram)元语模型的一般接口。所有的概率都在log域的。
本接口的属性:
@S4String(defaultValue = ".")
public final static String PROP_LOCATION = "location";属性用来确定语言模型的位置。
@S4Double(defaultValue = 1.0)
public final static String PROP_UNIGRAM_WEIGHT = "unigramWeight";属性确定了单元语言的权重。即the unigram weight。
@S4Integer(defaultValue = -1)
public final static String PROP_MAX_DEPTH = "maxDepth";属性确定了语言模型(getMaxDepth())调用所记录的最大深度。如果此属性被设置为(-1)(默认)语言模型所报告的模型的隐式的深度。此属性允许一个更深的语言模型被使用。例如:一个3trigram元语言模型能够被当做一个a bigram model(2元)语言模型使用通过设置此属性为2.注意如果此属性被设置成一个比默认(隐式)值大的值,则隐式深度被使用。对于此属性合法的值为1..N和-1 。
@S4Component(type = Dictionary.class)
public final static String PROP_DICTIONARY = "dictionary";属性确定了使用的字典。
public void allocate();为创建语言模型分配资源。
  public void deallocate();释放分配给此语言模型的资源。
public void start();在识别之前调用。
  public void stop();识别结束后调用。
public float getProbability(WordSequence wordSequence);获得字列表表示的字序列的n-gram probability(n元语法概率);输入参数:wordSequence为字序列。返回的是字序列的概率。是在log域的。
public float getSmear(WordSequence wordSequence);为给定的字序列获得Smear term。此方法在LexTreeLinguist中使用。详细请见:LexTreeLinguist的PROP_WANT_UNIGRAM_SMEAR属性。返回的是与输入字序列相关的Smear term。
public Set<String> getVocabulary();返回在此语言模型中的字的集合。此集合是不可改变的。返回的是不可改变的字集合。
public int getMaxDepth();返回的是语言模型的最大深度。
}</span>

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值