概述
Sphinx4是一个纯Java语音识别库。它提供了一个快速、简单的 API,可借助 CMUSphinx 声学模型将语音记录转换为文本。它可以在服务器和桌面应用程序中使用。除了语音识别之外,Sphinx4 还有助于识别说话者、调整模型、将现有转录与音频对齐以设置时间戳等。
Sphinx4 支持美国英语和许多其他语言。
在您的项目中使用 sphinx4
与 Java 中的任何库一样,使用 sphinx4 所需要做的就是将 jar 添加到项目的依赖项中,然后就可以使用 API 编写代码。
使用 sphinx4 最简单的方法是使用现代构建工具,例如 Apache Maven或 Gradle。 Sphinx-4 在Sonatype OSS 存储库中作为 Maven 包提供。
在 gradle 中,您需要以下几行build.gradle
:
repositories {
mavenLocal()
maven { url "https://oss.sonatype.org/content/repositories/snapshots" }
}
dependencies {
compile group: 'edu.cmu.sphinx', name: 'sphinx4-core', version:'5prealpha-SNAPSHOT'
compile group: 'edu.cmu.sphinx', name: 'sphinx4-data', version:'5prealpha-SNAPSHOT'
}
要在您的 Maven 项目中使用 sphinx4,请在您的以下位置指定此存储库pom.xml
:
<project>
...
<repositories>
<repository>
<id>snapshots-repo</id>
<url>https://oss.sonatype.org/content/repositories/snapshots</url>
<releases>
<enabled>false</enabled>
</releases>
<snapshots>
<enabled>true</enabled>
</snapshots>
</repository>
</repositories>
...
</project>
然后添加sphinx4-core
项目依赖: