CMUS狮身人面像(九)-使用 sphinx4 (5 pre-alpha 版本)构建应用程序

悟V-SpHeNIC

已于 2024-06-08 04:32:20 修改

阅读量1.3k

点赞数 28

分类专栏：音视频文章标签：语音识别

于 2024-04-28 01:13:49 首次发布

本文链接：https://blog.csdn.net/jasonhongcn/article/details/138262427

版权

本文介绍了Sphinx4，一个纯Java语音识别库，支持语音转文本、说话者识别等功能。详细讲解了如何在Java项目中添加依赖，使用Gradle或Maven集成，以及提供了一个简单的代码示例。还介绍了配置参数和高级接口，如实时语音识别器和语音对齐器。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

概述

Sphinx4是一个纯Java语音识别库。它提供了一个快速、简单的 API，可借助 CMUSphinx 声学模型将语音记录转换为文本。它可以在服务器和桌面应用程序中使用。除了语音识别之外，Sphinx4 还有助于识别说话者、调整模型、将现有转录与音频对齐以设置时间戳等。

Sphinx4 支持美国英语和许多其他语言。

在您的项目中使用 sphinx4

与 Java 中的任何库一样，使用 sphinx4 所需要做的就是将 jar 添加到项目的依赖项中，然后就可以使用 API 编写代码。

使用 sphinx4 最简单的方法是使用现代构建工具，例如 Apache Maven或 Gradle。 Sphinx-4 在Sonatype OSS 存储库中作为 Maven 包提供。

在 gradle 中，您需要以下几行build.gradle：

repositories {
    mavenLocal()
    maven { url "https://oss.sonatype.org/content/repositories/snapshots" }
}

dependencies {
    compile group: 'edu.cmu.sphinx', name: 'sphinx4-core', version:'5prealpha-SNAPSHOT'
    compile group: 'edu.cmu.sphinx', name: 'sphinx4-data', version:'5prealpha-SNAPSHOT'
}

要在您的 Maven 项目中使用 sphinx4，请在您的以下位置指定此存储库pom.xml：

<project>
...
    <repositories>
        <repository>
            <id>snapshots-repo</id>
            <url>https://oss.sonatype.org/content/repositories/snapshots</url>
            <releases>
                <enabled>false</enabled>
            </releases>
            <snapshots>
                <enabled>true</enabled>
            </snapshots>
        </repository>
    </repositories>
...
</project>

然后添加sphinx4-core项目依赖：