语音转写(讯飞开放平台)工具类

语音转写(讯飞开放平台)工具类

https://www.xfyun.cn/doc/asr/lfasr/Java-SDK.html#_1%E3%80%81%E7%AE%80%E4%BB%8B

import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONArray;
import com.alibaba.fastjson.JSONObject;
import com.iflytek.msp.lfasr.LfasrClient;
import com.iflytek.msp.lfasr.model.Message;
import lombok.extern.slf4j.Slf4j;
import org.springframework.stereotype.Repository;

import java.io.File;
import java.io.FileOutputStream;
import java.io.InputStream;
import java.net.URL;
import java.net.URLConnection;
import java.util.UUID;
import java.util.concurrent.TimeUnit;

/**
 * 语音转写工具类
 * @author MWX
 * @date 2021/1/19 16:11
 */

@Slf4j
@Repository
public class PhoneticTranscriptionUtil{
    //讯飞平台申请(语音转写)不过每天有限制
    public static final String APP_ID = "";
    public static final String SECRET_KEY = "";

    /**
     * 标准语音转写
     * @param localPath 本地文件路径
     *     //音频文件路径
     *     //1、绝对路径:D:\......\demo-3.0\src\main\resources\audio\lfasr.wav
     *     //2、相对路径:./resources/audio/lfasr.wav
     *     //3、通过classpath:
     * @throws InterruptedException
     */
    private static String standard(String localPath) throws Exception {
        //1、创建客户端实例
        LfasrClient lfasrClient = LfasrClient.getInstance(APP_ID, SECRET_KEY);
        //2、上传
        Message task = lfasrClient.upload(localPath);
        String taskId = task.getData();
        log.info("转写任务 taskId{}",taskId);
        //3、查看转写进度
        int status = 0;
        while (status != 9) {
            Message message = lfasrClient.getProgress(taskId);
            JSONObject object = JSON.parseObject(message.getData());
            status = object.getInteger("status");
            System.out.println(message.getData());
            TimeUnit.SECONDS.sleep(10);
        }
        //4、获取结果
        Message result = lfasrClient.getResult(taskId);
        JSONArray jsonArray=JSON.parseArray(result.getData());
        String str = "";
        for (int i = 0 ; i < jsonArray.size();i++){
            JSONObject rowData = new JSONObject(jsonArray.getJSONObject(i));
            String ret = rowData.getString("onebest");
            str= str.concat(ret);
        }
        return str;
    }


    //java 通过url下载录音文件保存到本地
    public static String download(String urlString) throws Exception {
        // 构造URL
        URL url = new URL(urlString);
        // 打开连接
        URLConnection con = url.openConnection();
        // 输入流
        InputStream is = con.getInputStream();
        // 1K的数据缓冲
        byte[] bs = new byte[1024];
        // 读取到的数据长度
        int len;
        // 输出的文件流(输出到项目根目录)
        String filename = "./" + UUID.randomUUID() + ".wav";  //下载路径及下载图片名称

        File file = new File(filename);
        FileOutputStream os = new FileOutputStream(file, true);
        // 开始读取
        while ((len = is.read(bs)) != -1) {
            os.write(bs, 0, len);
        }
        // 完毕,关闭所有链接
        os.close();
        is.close();
        String result = standard(filename);

        if(file.isFile() && file.exists()){
            boolean delete = file.delete();
        }

        return result;

    }

//    public static void main(String[] args) {
//        try {
//            long startTime = System.currentTimeMillis(); // 获取开始时间
//            SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");//设置日期格式
//            System.out.println(df.format(new Date()));// new Date()为获取当前系统时间
//            download("http://sfc-audio-test.oss-cn-shenzhen.aliyuncs.com/sfc-audio%2F20210119_225424.opus?OSSAccessKeyId=LTAI4G7FTdwrxSw13sDddjV7&Expires=1611117983&Signature=a0eYBLPHgDhIQpluQakpmy69%2Bp8%3D");
//            long endTime = System.currentTimeMillis(); // 获取结束时间
//            System.out.println("程序总运行时间: " + (endTime - startTime) + "ms");//opus   129394ms  //103799ms  //123282ms  //wav  331109ms
//        } catch (Exception e) {
//            e.printStackTrace();
//        }
//    }

}
开放平台提供了多种语音转写的API接口,其中包括了语音转写、实时语音转写、批量转写等功能。开发者可以使用Python语言调用这些API接口,实现自己的语音转写功能。 以下是使用Python调用开放平台语音转写API的示例代码: ```python import requests import time import hashlib import base64 # 访问开放平台语音转写API的URL地址 url = "http://api.xfyun.cn/v1/service/v1/iat" # 开放平台提供的AppID和API密钥 app_id = "your_app_id" api_key = "your_api_key" # 需要转写语音文件路径 audio_file = "your_audio_file_path" # 构造HTTP请求头部信息 cur_time = str(int(time.time())) param = "{\"engine_type\":\"sms16k\",\"aue\":\"raw\"}" param_base64 = str(base64.b64encode(param.encode('utf-8')), 'utf-8') m2 = hashlib.md5() m2.update((api_key + cur_time + param_base64).encode('utf-8')) check_sum = m2.hexdigest() header = { "X-CurTime": cur_time, "X-Param": param_base64, "X-Appid": app_id, "X-CheckSum": check_sum, "Content-Type": "application/x-www-form-urlencoded; charset=utf-8", } # 读取语音文件内容,并进行base64编码 with open(audio_file, "rb") as f: audio_data = base64.b64encode(f.read()).decode('utf-8') # 构造HTTP请求的参数信息 data = { "audio": audio_data } # 发送HTTP POST请求,获取响应结果 response = requests.post(url, headers=header, data=data) result = response.json() # 输出语音转写的文本结果 if result["code"] == "0": print(result["data"]) else: print(result["desc"]) ``` 需要注意的是,访问开放平台语音转写API需要提供AppID和API密钥,这些信息可以在开发者中心获取。另外,语音文件需要进行base64编码后才能传输到API接口中。 以上代码仅提供了基本的语音转写功能,开发者可以根据自己的需求调用不同的API接口,实现更复杂的语音转写功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值