java使用vosk开源框架完成离线版语音识别,中文语言模型可训练

vosk 官网

  1. 链接: https://alphacephei.com/vosk/

  2. 可以下载中文模型
    在这里插入图片描述

  3. 有训练的方法
    在这里插入图片描述

java使用vosk

  1. 引入依赖
    <!-- 获取音频信息 -->
    <dependency>
      <groupId>org</groupId>
      <artifactId>jaudiotagger</artifactId>
      <version>2.0.3</version>
    </dependency>

<!-- 语音识别 -->
<dependency>
    <groupId>net.java.dev.jna</groupId>
    <artifactId>jna</artifactId>
    <version>5.7.0</version>
</dependency>
<dependency>
    <groupId>com.alphacephei</groupId>
    <artifactId>vosk</artifactId>
    <version>0.3.32</version>
</dependency>

  1. 使用方法

    public static void main(String[] args) {
        LibVosk.setLogLevel(LogLevel.DEBUG);
        File file = new File("D:\\test.wav");//语音文件仅支持wav
        try (Model model = new Model(System.getProperty("user.dir")+ "/src/main/resources/vosk-model-small-cn-0.22");//模型地址
             InputStream ais = AudioSystem.getAudioInputStream(new BufferedInputStream(new FileInputStream(file))); 
             Recognizer recognizer = new Recognizer(model, getSampleRate(file))) { 

            //recognizer.setWords(true); // 开启词信息的详细输出

            int bytes;
            byte[] b = new byte[4096];//缓存大小:4k
            while ((bytes = ais.read(b)) >= 0) {
                recognizer.acceptWaveForm(b, bytes);
            }
            System.out.println(recognizer.getFinalResult() );
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

    /**
     * 获取采样率,采样率为音频采样率的声道倍数
     */
    private static  Float getSampleRate(File file) throws Exception {
        WavFileReader fileReader = new WavFileReader();
        AudioFile audioFile = fileReader.read(file);
        String sampleRate = audioFile.getAudioHeader().getSampleRate();
        String channel = audioFile.getAudioHeader().getChannels();
        System.out.println("语音的声道:" + channel );
        System.out.println("语音的采样率:" + sampleRate);
        return Float.parseFloat(sampleRate) * Integer.parseInt(channel);
    }

  • 6
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Vosk 是一个开源语音识别工具包,支持多种语言,包括 Java使用 Vosk 进行语音识别,需要按照以下步骤进行操作: 1. 下载 VoskJava 绑定库,并将其导入到 Java 项目中。 2. 下载 Vosk 的语音模型,可以从官方网站下载或者使用其他适合的语音模型。 3. 编写 Java 代码,读取音频文件并调用 Vosk 库中的方法进行语音识别。 4. 对识别结果进行处理和分析。 下面是一个简单的 Java 代码示例,实现了基于 Vosk语音识别功能: ```java import java.io.File; import java.io.FileInputStream; import java.io.InputStream; import org.vosk.Model; import org.vosk.Recognizer; import org.vosk.SpeechRecognitionResult; public class VoskExample { public static void main(String[] args) throws Exception { // 加载语音模型 Model model = new Model("model_path"); // 创建语音识别器 Recognizer recognizer = new Recognizer(model); // 读取音频文件 InputStream inputStream = new FileInputStream(new File("audio_file_path")); byte[] buffer = new byte[1024]; int bytesRead; // 开始语音识别 recognizer.recognizerStart(); while ((bytesRead = inputStream.read(buffer)) > -1) { // 接收音频数据并进行识别 recognizer.recognize(buffer, bytesRead); } // 结束语音识别 recognizer.recognizeFinalize(); // 获取识别结果 SpeechRecognitionResult result = recognizer.getResult(); System.out.println(result.getText()); // 释放资源 recognizer.close(); } } ``` 需要注意的是,Vosk语音识别功能需要一定的计算资源和时间,识别的准确率也会受到多种因素的影响,如音频质量、语音模型的质量等。因此,在实际应用中需要进行充分的测试和优化。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值