第一步,在语音报销工单信息录入的场景下,模型的输入为报销工单相关的音频文件。可以根据设备类型,选取合适的录音软件来录制音频文件,保存格式应为``.wav``数据格式。若音频文件格式不符,可以调用脚本转换格式
第二步,然后在BaiduAI开放平台创建语音识别应用以获取API Key和Secret Key。其实就是构建个模型,能把声音数据转换成文本数据,之后用信息提取模型根据schema提取需要的信息
第三步,对上面提取的数据进行预处理,转换成prompt数据集,之后训练模型
第一步,在语音报销工单信息录入的场景下,模型的输入为报销工单相关的音频文件。可以根据设备类型,选取合适的录音软件来录制音频文件,保存格式应为``.wav``数据格式。若音频文件格式不符,可以调用脚本转换格式
第二步,然后在BaiduAI开放平台创建语音识别应用以获取API Key和Secret Key。其实就是构建个模型,能把声音数据转换成文本数据,之后用信息提取模型根据schema提取需要的信息
第三步,对上面提取的数据进行预处理,转换成prompt数据集,之后训练模型