Sphinx-4 API
三片叶子贰
是一种非常特殊的、可以从事程序开发、维护的动物。
展开
-
StatisticsVariable
public class StatisticsVariable代表了一个被命名的值。一个统计变量能够被用来跟踪数据,它允许在任何时候被查看和打印输出(输出)。统计数字被保留在一个数据池中,并且以场景来分组。统计数据能够被当做一个整体打印出或被创建所输出。本类的属性: private static final Map<String,StatisticsVariable> pool = new翻译 2017-07-03 10:28:11 · 134 阅读 · 0 评论 -
WordPruningBreadthFirstSearchManager API
public class WordPruningBreadthFirstSearchManagerextends TokenSearchManager提供了一个宽度优先搜索。为了执行识别,应用程序在识别开始前需调用initialize初始化,然后在重复调用recognize方法,直到result.isfinal()返回为true。一旦一个final结果已经获得,则stoprecognize方法转载 2017-07-03 11:42:43 · 199 阅读 · 0 评论 -
RaisedCosineWindower API及加窗
[java] view plain copy print?<span style=“font-size:24px;”>本类的构造方法 public RaisedCosineWindower( );空构造方法 public RaisedCosineWindower( double alpha, float windowSizeInMs, float windowShiftInMs );非空构造方法转载 2017-07-21 11:22:22 · 451 阅读 · 0 评论 -
AbstractFeatureExtractor API
[java] view plain copy print?<span style=“font-size:24px;”>public abstract class AbstractFeatureExtractor extends BaseDataProcessor 本类对于紧挨着信号的doubledata数据对象是需要特殊处理的,有此类型的doubledata数据的前或者后是没有doubledata转载 2017-07-21 11:24:49 · 258 阅读 · 0 评论 -
DeltasFeatureExtractor API 及特征提取
转:http://blog.csdn.net/taiyb/article/details/46336327转载 2017-07-21 11:31:02 · 641 阅读 · 0 评论 -
DiscreteCosineTransform API 及离散余弦变化
转:http://blog.csdn.net/taiyb/article/details/46336419转载 2017-07-21 11:32:42 · 220 阅读 · 0 评论 -
MelFilter API 及mel 滤波器
转:http://blog.csdn.net/taiyb/article/details/46350511转载 2017-07-21 11:34:13 · 971 阅读 · 0 评论 -
MelFrequencyFilterBank API 及Mel频率滤波器
[java] view plain copy print?<span style=“font-size:24px;”>本类的方法: public void newProperties(PropertySheet ps);对属性进行改变时,调用,对属性的设置与构造方法的设置一样。对滤波器个数,最小频率,最大频率,logger。进行的设置。 public void initialize();在此方法转载 2017-07-21 11:35:56 · 1639 阅读 · 0 评论 -
SpeechMarker API 与端点检测
[html] view plain copy print?<span style=“font-size:32px;”>public class SpeechMarker extends BaseDataProcessor 经过本类处理后的数据流中含数的为:SPEECH_START信号, SPEECH_END信号, DoubleData(包含语音和非语音),DataStartSignal信号和Dat转载 2017-07-21 11:39:36 · 363 阅读 · 0 评论 -
SpeechClassifier API 与端点检测
[html] view plain copy print?<span style=“font-size:32px;”>public class SpeechClassifier extends AbstractVoiceActivityDetector 经过本类处理后的数据流中含数的为:SpeechClassifiedData(语音和非语音),DataStartSignal信号和DataEndSi转载 2017-07-21 11:57:18 · 651 阅读 · 0 评论 -
SpeechClassifiedData API
[java] view plain copy print?<span style=“font-size:24px;”>public class SpeechClassifiedData implements Data 作用:此类包含一个DoubleData对象,此类用来指示所包含的doubledata是否为语音。 本类属性: private boolean isSpeech;是否是语音的标记。转载 2017-07-21 12:01:24 · 266 阅读 · 0 评论 -
NonSpeechDataFilter API
[java] view plain copy print?<span style=“font-size:24px;”>public class NonSpeechDataFilter extends BaseDataProcessor 经过本类处理后的数据流中含数的为:SpeechStartSignal信号, SpeechEndSignal信号,DoubleData(仅包含语音),DataStar转载 2017-07-21 12:02:56 · 332 阅读 · 0 评论 -
WordPruningBreadthFirstSearchManager API
public class WordPruningBreadthFirstSearchManagerextends TokenSearchManager提供了一个宽度优先搜索。为了执行识别,应用程序在识别开始前需调用initialize初始化,然后在重复调用recognize方法,直到result.isfinal()返回为true。一旦一个final结果已经获得,则stoprecognize方法转载 2017-07-18 17:04:53 · 180 阅读 · 0 评论 -
SimpleBreadthFirstSearchManager API
public class SimpleBreadthFirstSearchManager extends TokenSearchManager提供深度优先搜索。为了进行识别处理,应用程序在进行识别处理前需调用initialize即进行初始化,然后重复的调用recognize方法,直到Result.isFinal()返回为true为止。一旦得到了一个最终的结果,terminate方法将被调用。转载 2017-07-18 17:12:49 · 250 阅读 · 0 评论 -
DiscreteFourierTransform API 及FFT(快速傅里叶变化)总结
public class DiscreteFourierTransform extends BaseDataProcessor本类的注释翻译:计算一个输入序列的离散傅里叶变换(DFT)时,使用的快速傅里叶变换(FFT).傅里叶变换是一个把信号放入其频率(成分)分析的过程。在语音中,我们不是分析整个语音连续的语音即整个持续期的语音,而是分析音频数据的一个窗口(帧)。这个窗口是对输入信号进行滑动汉明转载 2017-07-18 17:15:31 · 1141 阅读 · 0 评论 -
Preemphasizer API 及预加重
转自:http://blog.csdn.net/taiyb/article/details/46315821转载 2017-07-18 17:17:41 · 385 阅读 · 0 评论 -
ActiveListManager API
public interface ActiveListManager extends Configurable一个被当做以排序的列表的活动列表。@S4Integer(defaultValue= 2000)public final static String PROP_ABSOLUTE_WORD_BEAM_WIDTH =“absoluteWordBeamWidth”;属性确定了绝对的字的beam宽转载 2017-07-03 11:41:05 · 251 阅读 · 0 评论 -
TokenSearchManager API
abstract public class TokenSearchManagerimplements SearchManager抽象类,实现了SearchManager接口。本类的属性:@S4Boolean(defaultValue = true)public final static String PROP_BUILD_WORD_LATTICE =“buildWordLatti转载 2017-07-03 11:38:41 · 236 阅读 · 0 评论 -
ActiveList API
public interface ActiveList extends Iterable<Token>一个被当做以排序的列表的活动列表。此列表可以通过迭代的方法来访问其的元素。本接口的属性:@S4Integer(defaultValue= 2000)public final static String PROP_ABSOLUTE_BEAM_WIDTH =“absoluteBeamWid转载 2017-07-03 11:37:26 · 253 阅读 · 0 评论 -
StatisticsVariable
public class StatisticsVariable代表了一个被命名的值。一个统计变量能够被用来跟踪数据,它允许在任何时候被查看和打印输出(输出)。统计数字被保留在一个数据池中,并且以场景来分组。统计数据能够被当做一个整体打印出或被创建所输出。本类的属性: private static final Map<String,StatisticsVariable>pool = ne转载 2017-07-03 10:36:54 · 153 阅读 · 0 评论 -
LogMath
public final class LogMath implements Configurable, Serializablelog(a - b) = log(a) + log(1- exp(log(b)-log(a)))log(a + b) = log(a) +log(1 + exp(log(b)- log(a)))作用:首先本类是一个component即可配置类。本类主要的作用是:提转载 2017-07-03 10:46:59 · 328 阅读 · 0 评论 -
Complex
public class Complex本类实现了复数类型,及复数域的基本算法。本类的属性: private double real;一个复数对象的实部private double imaginary;复数对象的虚部即一个复数数字的虚部。本类的构造方法:public Complex();构造一个实部和虚部都是0的复数对象(数字)。public Complex(double re转载 2017-07-03 10:50:31 · 873 阅读 · 0 评论 -
Shohix3声学模型的训
1训练的基本步骤:…32模拟未绑定状态的场景依赖音素的注意事项:…43 你所需准备的数据…44,训练之前需检查的项…56 当你有一个非常小的闭合的词汇表(字典)(50—60字):…67 “base”集合和高阶特征向量…68 特征流(featuresstreams)…69训练连续模型…710 创建模型定义文件:文件后缀为.mdef711,创建HMM拓扑文件文件后缀为.转载 2017-07-03 11:06:57 · 1225 阅读 · 0 评论 -
混淆网络和词格或者字格
一个字格是一个有向无环图。它有一个单独的起点和标记了一个字和其权重的边(为单独边)。不像强制要求每一条路径都必须通过所有节点的混淆网络。字格的路径是不要求每一条都通过其所有节点的。字格能够表示任何的有限的字符串集,尽管这一般使得字格低于混淆网络的空间效率。不管怎样,一般一个字格能够表示以多项式空间的指数数量的句子。以下为字格的一个实例表示了组合字的可能的分解:混淆网络(CN)也称之为sausage,转载 2017-07-03 11:10:11 · 784 阅读 · 0 评论 -
GState
本类方法:private Set<UnitContext> getStartingContexts();得到此节点的开始场景集,开始场景为一个长度等于最大的右场景尺寸的unit[]集。如果此节点为空节点,则开始场景是此节点直接后续节点的所有开始场景的集合,否则的话从节点字的每一发音来创建开始场景。返回的是startingContexts属性。private UnitContext getStar转载 2017-07-03 11:11:56 · 431 阅读 · 0 评论 -
sphinx4的数据处理器的构建
一般具体的数据处理器都有两个构造方法,一个为空的,一个为非空。我们可以用非空的构造方法动态的创建数据处理器。用空的话,一般需要在文件中配置,并通过newproperties()方法来完成数据处理器的配置。数据处理器配置完后一般要调用initialize()方法来初始化数据处理器。这主要看类的具体实现所决定。转自:http://blog.csdn.net/taiyb/article/details/3转载 2017-07-03 11:14:11 · 288 阅读 · 0 评论 -
sphinx4的Microphone
sphinx4的Microphone <div class="article_manage clearfix"> <div class="article_l"> <span class="link_categories"> 标签: <a href="http://www.c转载 2017-07-03 11:15:29 · 261 阅读 · 0 评论 -
sphinx4 FrontEnd
public class FrontEnd extends BaseDataProcessor在sphinx-4系统中,系统把整个前端处理当作一个前端类,此类把所有的信号处理流程都集合起来,只要通过此类我们就能获得整个前端的输出。通过对此类的操作我们能够修改信号处理的流程。就可得到我们所需的处理的流程和前端处理的结果。作用: FrontEnd(前端)是一个component(configura转载 2017-07-03 11:17:59 · 280 阅读 · 0 评论 -
sphinx 4 AbstractDecoder
public abstract class AbstractDecoderimplements ResultProducer, Configurable一个抽象的解码器,此解码器实现了独立于被使用的(pull/push)的解码框架的全部方法的实现。本类的属性: @S4Component(type =SearchManager.class) public final static S转载 2017-07-03 11:19:20 · 208 阅读 · 0 评论 -
Recognizer API
public class Recognizer implements Configurable, ResultProducer此为识别了设置了相应的状态,以防止在某些方法在其必要的条件之前被调用。使用了异常处理。靠继承RuntimeException来实现新的异常类。Sphinx4识别器。此是sphinx4的主要的入口。一个识别器的典型使用如下:public void recognizeDi转载 2017-07-03 11:21:03 · 220 阅读 · 0 评论 -
Result API
public class Result 提供识别的结果。结果可以是局部的,也可以是最终的。一个result结果在它是最终结果之前不应该被修改。注意一个result结果也许不会保护所有可能的信息。The following methods arenot yet defined but should be: * <pre> * public Result getDAG(intcompressi转载 2017-07-03 11:22:21 · 2718 阅读 · 0 评论 -
Decoder API
public class Decoder extends AbstractDecoder原始解码器类。 @S4Integer(defaultValue= 100000) public final static String PROP_FEATURE_BLOCK_SIZE =“featureBlockSize”;private int featureBlockSize;定义了一次识转载 2017-07-03 11:33:25 · 375 阅读 · 0 评论 -
FrameDecoder API
public class FrameDecoder extends AbstractDecoderimplements DataProcessor一个解码器,此解码器没有使用s4常用的pull模式。而是每次调用decode()方法仅仅处理一个单独的特征帧。当使用此解码器时,需确保搜索管理使用的声学打分器能够使用缓存的data 特征数据即矢量。本类的属性: private DataProce转载 2017-07-03 11:34:40 · 299 阅读 · 0 评论 -
Token API
public class Token implements Scoreable从上可以看出Token实现了Scoreable接口,可知此类对象是可以被打分器打分的。此类对象代表了再识别框架中的一个单独状态,一个Token(标记)的子类被用于表示不同的发射状态。注意所有的打分是基于log域的。本类的属性:private static int curCount;为标记的当前计数。privat转载 2017-07-03 11:36:16 · 523 阅读 · 0 评论 -
AbstractVoiceActivityDetector
[java] view plain copy print?<span style=“font-size:24px;”>public abstract class AbstractVoiceActivityDetector extends BaseDataProcessor 一个抽象的分析器,它标志了上一个正处理的帧中的语音的出现。这种信息能被用于噪声滤波组件(component),以便估计噪声频谱转载 2017-07-24 10:35:35 · 212 阅读 · 0 评论