Vosk Android使用方法

文章介绍了如何在Android项目中集成开源语音识别框架Vosk,包括下载源码、编译SO库、导入模型文件、创建Android工程、配置build.gradle文件,以及实现模型初始化和语音识别接口。用户可以将编译好的aar包添加到自己的项目中,并使用提供的接口进行语音识别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Vosk是一个基于kaldi的开源语音识别框架,支持多种编程语言和多个平台,易于使用和集成,是做语音识别时很好的选择。使用步骤如下:

  1. 下载vosk源码:源码地址

  1. 利用源码编译so库,不会编译的小伙伴可以从这里下载aar包:libvosk.so,然后把文件后缀名从.aar改为.zip,再解压这个文件即可在其中jni目录下找到so库。

  1. 删除源码vosk-api-0.3.45\android\lib\src\main\jniLibs这个目录下的文件,把编译好的so库放在这个目录下。

  1. 下载官方提供的模型文件:vosk-model-small-cn-0.22,会使用kaldi训练模型的伙伴也可以自行生成自己的模型文件。然后在vosk-api-0.3.45\android\lib\src\main目录下新建assets目录,把模型文件放在assets目录下。

  1. 新建一个Android工程,import module把vosk-api-0.3.45\android\lib这个导入到项目中。

  1. 修改module build.gradle文件,加入以下代码:

apply plugin: 'com.android.library'
apply plugin: 'maven-publish'
...
...
dependencies {
    api 'net.java.dev.jna:jna:4.4.0@aar'
}

//preBuild.dependsOn buildVosk

publishing {
    publications {
        aar(MavenPublication) {
            artifactId = archiveName
            artifact("$buildDir/outputs/aar/$archiveName-release.aar")
            pom {
                name = pomName
                description = pomDescription
            }
            //generate pom nodes for dependencies
            pom.withXml {
                def dependenciesNode = asNode().appendNode('dependencies')
                configurations.implementation.allDependencies.each { dependency ->
                    if (dependency.name != 'unspecified') {
                        def dependencyNode = dependenciesNode.appendNode('dependency')
                        dependencyNode.appendNode('groupId', dependency.group)
                        dependencyNode.appendNode('artifactId', dependency.name)
                        dependencyNode.appendNode('version', dependency.version)
                    }
                }
            }
        }
    }
}



tasks.register('genUUID') {
    def uuid = UUID.randomUUID().toString()
    def odir = file("$buildDir/generated/assets/vosk-model-small-cn")
    def ofile = file("$odir/uuid")
    doLast {
        mkdir odir
        ofile.text = uuid
    }
}

preBuild.dependsOn(genUUID)

其中def odir = file("$buildDir/generated/assets/vosk-model-small-cn")这里的名称要和自己的模型名称一致。

  1. module新建VoskClient.java,主要用来对外部提供模型初始化和语音识别的接口,模型初始化的接口如下:

public void initModel() {
        StorageService.unpack(context.getApplicationContext(), "vosk-model-small-cn", "model",
                (model) -> {
                    this.model = model;
                },
                (exception) -> Log.e("Voice Recognization ", "initModel: unpack error"));
    }

语音识别的接口如下:

//识别麦克风语音,需要动态申请RECORD_AUDIO权限
private void recognizeMicrophone() {
        if (speechService != null) {
            speechService.stop();
            speechService = null;
        } else {
            try {
                Recognizer rec = new Recognizer(model, 16000.0f);
                speechService = new SpeechService(rec, 16000.0f);
                speechService.startListening(this);
            } catch (IOException e) {
            }
        }
    }
//识别文件语音,需要动态申请READ_EXTERNAL_STORAGE权限,文件须是pcm编码格式的wav文件
private void recognizeFile() {
        if (speechStreamService != null) {
            speechStreamService.stop();
            speechStreamService = null;
        } else {
            try {
                //16000.f为采样率,设置为你自己文件的采样率
                Recognizer rec = new Recognizer(model, 16000.f, "[\"one zero zero zero one\", " +
                        "\"oh zero one two three four five six seven eight nine\", \"[unk]\"]");

                InputStream ais = getAssets().open(
                        "yourfile.wav");
                if (ais.skip(44) != 44) throw new IOException("File too short");

                speechStreamService = new SpeechStreamService(rec, ais, 16000);
                speechStreamService.start(this);
            } catch (IOException e) {
            }
        }
    }
  1. 把module打包成aar包,就可以在自己任意的项目中使用了。

注:如果打包成aar包使用,那么还需要在app的gradle文件中加入依赖:

dependencies {
    api 'net.java.dev.jna:jna:4.4.0@aar'
    ......
}

本次内容到这里就结束了,下篇文章分析vosk android java层的源码。

为了在Windows安装ADB工具,你可以按照以下步骤进行操作: 1. 首先,下载ADB工具包并解压缩到你自定义的安装目录。你可以选择将其解压缩到任何你喜欢的位置。 2. 打开运行窗口,可以通过按下Win+R键来快速打开。在运行窗口中输入"sysdm.cpl"并按下回车键。 3. 在系统属性窗口中,选择"高级"选项卡,然后点击"环境变量"按钮。 4. 在环境变量窗口中,选择"系统变量"部分,并找到名为"Path"的变量。点击"编辑"按钮。 5. 在编辑环境变量窗口中,点击"新建"按钮,并将ADB工具的安装路径添加到新建的路径中。确保路径正确无误后,点击"确定"按钮。 6. 返回到桌面,打开命令提示符窗口。你可以通过按下Win+R键,然后输入"cmd"并按下回车键来快速打开命令提示符窗口。 7. 在命令提示符窗口中,输入"adb version"命令来验证ADB工具是否成功安装。如果显示版本信息,则表示安装成功。 这样,你就成功在Windows安装ADB工具。你可以使用ADB工具来执行各种操作,如枚举设备、进入/退出ADB终端、文件传输、运行命令、查看系统日志等。具体的操作方法可以参考ADB工具的官方文档或其他相关教程。\[1\]\[2\]\[3\] #### 引用[.reference_title] - *1* [windows环境安装adb驱动](https://blog.csdn.net/zx54633089/article/details/128533343)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [Windows安装使用ADB简单易懂教程](https://blog.csdn.net/m0_37777700/article/details/129836351)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值