微信amr语音文件转文字功能实现

该项目需求涉及将微信中的非标准AMR语音文件通过后台处理转换为文字。使用ffmpeg将定制版AMR文件转化为标准PCM格式,以便调用百度语音识别接口进行文字识别。在实现过程中,通过引入一个封装了ffmpeg的Java项目来完成格式转换,并结合百度的语音识别API完成整个流程。部分关键代码已提及。
摘要由CSDN通过智能技术生成

项目需求:手机app或者微信里面的amr语音文件转换成文字的功能

实现方式:后台接收amr语音文件→调用百度语音识别接口转文字→返回结果

遇到的问题:百度语音识别接口只能识别标准的amr语音文件,微信里面的amr语音文件为定制版(非标准格式)

解决方式:用ffmpeg将amr语音文件转成百度能识别的标准pcm文件,详细参数参考自百度语音识别开发文档

https://ai.baidu.com/ai-doc/SPEECH/7k38lxpwf

一下是功能实现的部分代码:

1.引入jave项目(一个封装了ffmpeg的开源项目,用于格式转换)

<!--音频转换-->
        <dependency>
            <groupId>com.github.dadiyang</groupId>
            <artifactId>jave</artifactId>
            <version>1.0.5</version>
        </dependency>

 2.代码实现(百度语音识别的具体代码略,可以参照官方文档https://ai.baidu.com/ai-doc/SPEECH/pk4o0bkx8)

/**
     * 语音识别文件上传接口
     * @return
     */
    @PostMapping("/api/speech/upload")
    @ApiOperation(value = "语音识别文件上传接口")
    @ApiImplicitParams({
            @ApiImplicitParam(value = "音频文件(MultipartFile格式)", name = "file",paramType = "query",type = "MultipartFile")})
    public AjaxJson speechDistinguish(MultipartFile file){

        AjaxJson j = new AjaxJson();
        try {
            if(file==null){
                j.setSuccess(fal
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值