Java语音转文字功能


考虑到在识别mp3文件是否有声音之后,后续会做语音转文字这些功能
就提前去搜索了一下,貌似基本只能靠第三方来实现

百度智能云

1.创建一个百度/百度智能云用户,有的直接登录就行
2.进入右上角管理控制台
3.产品服务里面找到语音技术在这里插入图片描述4.
里面有多重方式
在这里插入图片描述
因为这里限制了语音时长,所以就不考虑,如果符合要求可以考虑这个

继续找
在这里插入图片描述在这里插入图片描述

这里就满足需求了

去下载demo,然后创建应用 ,提前领取免费的接口额度,虽然时间不长,足够测试用了

在这里插入图片描述

创建好之后会有个应用列表,里面有appID ,APIkey, Secret Key ,之后都会用到

在这里插入图片描述

JAVA代码实现

因为我是springboot项目,所以在pom.xml里面引入了依赖包

		<dependency>
			<groupId>com.squareup.okhttp3</groupId>
			<artifactId>okhttp</artifactId>
			<version>4.2.1</version>
		</dependency>
		<!-- 引入org.json所需依赖 -->
		<dependency>
			<groupId>org.json</groupId>
			<artifactId>json</artifactId>
			<version>20190722</version>
		</dependency>

然后把demo里面的代码拷贝过来

修改Const 里面的配置信息 ,这里就用到了自己应用管理里面给你分配的

public interface Const {

    /* 下面2个是鉴权信息 ,具体参数在sendStartFrame() 方法内 */
    int APPID = APPID ;

    String APPKEY = "APPKEY ";

    /* dev_pid 是语言模型 , 可以修改为其它语言模型测试,如远场普通话 19362*/
    int DEV_PID = 15372;

    /* 可以改为wss:// */
    String URI = "ws://vop.baidu.com/realtime_asr";
}

接着发现文档描述的只支持pcm格式的音频文件
还好我提前去了解了一下sound包里面的audioInputStream
这里可以参考我上一篇写的
Java判断mp3文件是否有声音

使用inputStream 的子类audioInputStream 然后再配置format

测试:

在这里插入图片描述
在这里插入图片描述这里测试成功,能成功读取mp3里面内容

这里我用了工具Audacity把pcm文件转成mp3文件
不知道会不会有影响
有空我再去测一下其他mp3文件
当然这个文档也标明了嘈杂的环境等可能会对识别有影响
这篇文章应该是不完善的,只是提供一个思路
新手发帖,希望多多提一下宝贵的意见和建议,谢谢

  • 0
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值