一、申请 asr 授权
-
打开网址:http://my.ddrj.com,注册并登录。
-
点击“我的授权” -> “申请授权” (根据需求选择“在线”或是“离线”)。
-
找到 “asrproxy” 选择勾选“asrproxy”和“asrserver” ,然后点击右上角红色按钮。
-
根据要求填写信息,填写完后点击“申请”按钮。
-
告诉负责人,让他通过申请。如果图中的状态为“批准”,就可以下载程序了。
二、安装 asr 程序
- 将下载好的压缩包上传至服务器路径中:/root。
- 严格按照以下命令依次执行:
cd /root
mkdir -p /ddt/asrproxy
unzip asrproxy_*.zip -d /ddt/asrproxy
cd /ddt/asrproxy
chmod +x installlib.sh
./installlib.sh
chmod +x asrproxy
chmod +x cli
三、安装模型
“Paraformer语音识别-中文-通用-16k-实时”脚本命令:
curl -s http://129.211.24.206/downloadModel.sh | sh -s 4
“Paraformer语音识别-中文-通用-16k-离线”脚本命令:
curl -s http://129.211.24.206/downloadModel.sh | sh -s 5 a
四、配置 asrproxy.json文件
可以通篇复制到 asrproxy.json 文件中:
{
"key":"asrproxy.license", //授权文件路径
"log":{
"console_level":0, //输出控制台日志等级0-5(0:DEBUG, 1:INFO, 2:NOTICE, 3:WARNING, 4:CRIT, 5:CONSOLE)
"file_level":0, //输出到文件日志等级0-5(0:DEBUG, 1:INFO, 2:NOTICE, 3:WARNING, 4:CRIT, 5:CONSOLE)
"file_maxsize":100, //文件大于多少M就自动创建新的日志文件。
"file_number":10 //最大保留日志文件个数
},
//对接 mod_vad的模型配置,"short_sentence_asr"必不可少。
"short_sentence_asr":{
"listen_ip":"0.0.0.0",
"listen_port":9990,
"users":{
// samrtivr.json配置的keylist.id
"test":{
"key":"test", //smartivr.json配置的 keylist.secret
"ip":"*" //*任意IP都可以访问,也可以限制可以访问的ip
}
}
},
"asr":{
"listen_ip": "127.0.0.1", //实时识别监听的IP
"listen_port": 9988,
"storage": "record", //asr录音目录,调用asr时,设置了asr_params.recordfilename才会录音。
"acl":"*", //哪些IP可以访问,配置*任意IP都可以访问,多个IP用逗号隔开,如果不配置acl,通过127.0.0.1不需要配置在ACL里面也可以访问。
"interface": {
"paraformer_large_16k_online": {
"type": "funasr",
"engine": "2pass",
"enable_itn":false,
"itn":"model/itn",
"vad-dir":"model/speech_fsmn_vad_zh-cn-16k-common-pytorch",
"vad-quant":"true",
"model-dir": "model/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch",
"online-model-dir": "model/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online",
"punc-dir": "model/punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727",
"chunk-size":4800
},
"paraformer_large_16k": {
"type": "funasr",
"engine": "sentence",
"quantize":true,
"enable_itn":false,
"itn":"model/itn",
"vad-dir":"model/speech_fsmn_vad_zh-cn-16k-common-pytorch",
"vad-quant":"true",
"punc-dir":"model/punc_ct-transformer_cn-en-common-vocab471067-large-onnx",
"model-dir": "model/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch"
}
},
"groups":{
//对接mod_cti需要使用“default”
"default":{
"mode":0, //0:顺序使用,当使用数量等于count的时候切换下一个 1:循环使用
"enable": //启用的那些ASR配置
[
"paraformer_large_16k_online"
]
},
//对接mod_vad需要使用“shortsentence”
"shortsentence":{
"mode":0, //0:顺序使用,当使用数量等于count的时候切换下一个 1:循环使用
"enable": //启用的那些ASR配置
[
"paraformer_large_16k"
]
}
}
}
}
五、启动asr程序
启动
- 命令:./asrproxy
- 输出的授权信息正确 并且执行到 asrproxy run , 说明正常。
- 在 asrproxy 程序中可输入
ctrl+c
或者shutdown
退出。
自动启动设置
- 检查 asrproxy 进程文件是否存在于路径:/ddt/asrproxy/asrporxy。
如果不是,修改 asrcheck 脚本的路径,需要该脚本与 asrproxy 进程文件处于同一路径中;如果是,则继续下一步。 - 执行以下命令:
chmod +x /ddt/asrproxy/asrcheck
echo "*/1 * * * * root /ddt/asrproxy/asrcheck> /dev/null 2>&1" >> /etc/crontab
- 杀死 asrproxy 程序进程,查看1分钟后是否会自动启动。
六、测试方法
asrproxy.json 文件配置完成后,启动或是重启 asrproxy 程序。如果能成功启动程序,则说明配置文件配置得没有问题;反之,联系工作人员解决问题。
-
对接 mod_vad 方式的测试网址:http://ip:9990/test 。(其中的 ip 是 asrproxy 所在的服务器ip。)
测试方法:页面打开后,上传只有一句话的声音文件,然后点击“Submit”按钮,如果页面中能有文字识别出来,则说明对接 mod_vad 方式的模型配置完成。
页面展示:
-
对接 mod_cti 方式的测试网站:http://demo.ddrj.com/wsasr.html 。
打开页面后修改“asr服务器地址”,然后上传文件,如果同样能识别出文字,说明对接 mod_cti 方式的模型配置完成。
页面展示:
联系我们
有意向了解呼叫中心中间件的用户,可以点击该链接添加工作人员的微信:顶顶通小何的VX