【文本 >>> 语音】⭐️SpringBoot 结合 jacob 简单实现一个文本朗读功能

目录

🍸前言

🍻一、环境准备

🍺二、依赖引入    

💞️三、简单启动

🍹四、接口改造

        4.1  封装为一个工具类

        4.2 暴露一个接口

        4.3 测试

🌱五、扩展


🍸前言

        小伙伴们大家好,上次分享了一位读者使用国际化上下文 i18n 技术时遇到的兼容问题,也是成功帮他解决了问题,自己同时也学到这种使用方式;这次先放一放常用技术的学习,来看一个小工具,文本转语音,用 java 实现

🍻一、环境准备

        一台语音功能没问题的设备(因为要借用机器的语音设备)

        本地创建一个可以运行的 SpringBoot 项目,另外准备一个接口模拟工具即可

🍺二、依赖引入    

  jacob 是一个 Java COM (Component Object Model) 接口库,利用了 COM 接口来调用 Windows 的语音合成(TTS)服务,可以访问 Windows 的 Speech API 或者类似的语音合成工具,用于将文本转换为语音。

        在项目的 pom.xml 文件中添加以下依赖,刷新 maven 触发自动下载

<dependency>
    <groupId>com.hynnet</groupId>
    <artifactId>jacob</artifactId>
    <version>1.18</version>
</dependency>

注:首次启动的时候可能会遇到如下报错

Exception in thread "main" java.lang.UnsatisfiedLinkError: no jacob-1.18-x64 in java.library.path

         只需要手动下载解压后将文件放入到 JDK 的 bin 目录下即可

Release Release 1.18 · freemansoft/jacob-project · GitHub

         查看自己 JDK 安装位置的命令如下:

💞️三、简单启动

        使用语音功能的主要代码如下:

        有四个参数,第一个参数是控制生成的 .mps 多媒体文件的输出位置;

        第二个是所需语音阅读的文本内容

        第三个第四个是控制语音元素的

/**
     * 文本转音频
     *
     * @param path   音频生成路径(全路径,带文件名)(例:D:\\aa\\a.mp3)
     * @param text   文本内容
     * @param volume 音量大小 0 - 100
     * @param speed  语音朗读速度 -10 到 +10
     * @return 是否成功
     */
    public static boolean text(String path, String text, int volume, int speed) {
        try {

            // 调用dll朗读方法
            ActiveXComponent ax = new ActiveXComponent("Sapi.SpVoice");
            // 音量 0 - 100
            ax.setProperty("Volume", new Variant(volume));
            // 语音朗读速度 -10 到 +10
            ax.setProperty("Rate", new Variant(speed));
            // 输入的语言内容
            Dispatch dispatch = ax.getObject();
            // 本地执行朗读
            Dispatch.call(dispatch, "Speak", new Variant(text));

            //开始生成语音文件,构建文件流
            ax = new ActiveXComponent("Sapi.SpFileStream");
            Dispatch sfFileStream = ax.getObject();
            //设置文件生成格式
            ax = new ActiveXComponent("Sapi.SpAudioFormat");
            Dispatch fileFormat = ax.getObject();

            // 设置音频流格式
            Dispatch.put(fileFormat, "Type", new Variant(22));
            // 设置文件输出流格式
            Dispatch.putRef(sfFileStream, "Format", fileFormat);
            // 调用输出文件流打开方法,创建一个音频文件
            Dispatch.call(sfFileStream, "Open", new Variant(path), new Variant(3), new Variant(true));
            // 设置声音对应输出流为输出文件对象
            Dispatch.putRef(dispatch, "AudioOutputStream", sfFileStream);
            // 设置音量
            Dispatch.put(dispatch, "Volume", new Variant(volume));
            // 设置速度
            Dispatch.put(dispatch, "Rate", new Variant(speed));
            // 执行朗读
            Dispatch.call(dispatch, "Speak", new Variant(text));
            // 关闭输出文件
            Dispatch.call(sfFileStream, "Close");
            Dispatch.putRef(dispatch, "AudioOutputStream", null);

            // 关闭资源
            sfFileStream.safeRelease();
            fileFormat.safeRelease();
            // 关闭朗读的操作
            dispatch.safeRelease();
            ax.safeRelease();
            return true;
        } catch (Exception e) {
            e.printStackTrace();
        }
        return false;
    }

        测试下,因为只有本地能听到语音,所以这里就用打印验证方法执行没有出错,结果如下:

🍹四、接口改造

        本地测试,该依赖对接设备语音没有问题,在此基础上可以改造为一个接口,该接口的功能就是朗读接口传入的参数,改造后如下:

        4.1  封装为一个工具类

        这里把保存到本地的代码去掉了,因为只需要阅读即可,不用保留多媒体文件

import com.jacob.activeX.ActiveXComponent;
import com.jacob.com.Dispatch;
import com.jacob.com.Variant;

/**
 * @author HuangBen 
 */
public class SpeakUtil {

    /**
     * 文本转音频
     *
     * @param text   文本内容
     * @return 是否成功
     */
    public static boolean text(String text) {
        try {

            // 调用dll朗读方法
            ActiveXComponent ax = new ActiveXComponent("Sapi.SpVoice");
            // 音量 0 - 100
            ax.setProperty("Volume", new Variant(50));
            // 语音朗读速度 -10 到 +10
            ax.setProperty("Rate", new Variant(0));
            // 输入的语言内容
            Dispatch dispatch = ax.getObject();
            // 本地执行朗读
            Dispatch.call(dispatch, "Speak", new Variant(text));
            
            // 关闭朗读的操作
            dispatch.safeRelease();
            ax.safeRelease();
            return true;
        } catch (Exception e) {
            e.printStackTrace();
        }
        return false;
    }

}
        4.2 暴露一个接口

        使用一个 get 请求简单模拟下即可,请求到达之后首先创建一个线程进行语音朗读,主线程进行打印,这是为了防止请求参数过长时,迟迟收不到响应

    @GetMapping("/testVoice")
    public void testVoice(String word) {
        new Thread(() -> {
            SpeakUtil.text(word);
        }).start();
        System.out.println(word);
    }
        4.3 测试

 

🌱五、扩展

        这只是在本地测试使用的方式,实际上隐藏的问题还有很多,比如语音只能在本地机器触发,另外就是如果请求接口参数过长,多个请求同时来的话,可能处理不及时导致部分请求报错或者说无法语音,当然也有一些别的更成熟的依赖可以使用,比如谷歌(需要账号认证),本地只是小耍一下

        文章到这里就结束了~

  • 9
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

先锋 Coder

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值