ai智能电话机器人的放音文件设置

文章描述了一种语音交互系统,支持.wav和.mp3文件,使用TTS将文本转换为语音,变量在呼叫接通后执行。ASR识别用户说话并执行相应事件。系统还涉及知识库匹配、无输入和未匹配放音的处理策略,并限制流程重复执行以防止死循环。此外,节点重复执行时可配置不同声音文件,增加交互自然度。
摘要由CSDN通过智能技术生成

文件 后缀 .wav或者.mp3,或者前缀file://(文件格式尽量用wav,8000hz,16bit,单声道。)
信号音 前缀tone_stream://
静音 前缀silence_stream://,例如:silence_stream://1000 ,播放1000毫秒静音
变量 ${变量名},可以导入号码的时候设置号码关联的变量,会把变量会调用TTS转换成声音文件,如果变量是声音文件名应该 file://${cti_asr_last_recordfilename} 这样。如果变量是tts文本内容不能包含”!”,导入时候需要去除!,注意如果文字包含url保留字符比如?&空格,需要对先进行url编码,变量名可以用tts前缀,可以呼叫时候就预先执行tts,具体看外呼任务的tts配置说明。
文本 调用TTS转换成声音,因为大部分TTS有长度限制,比较长的句子,要分成多段。就是流程编辑器里面分成多行。
cti 模块有预先执行TTS的功能,为了不影响预先执行功能,变量要单独一行,比如不要 ${username}你好,应该在话术编辑器的输入框 ${username}放一行,你好放第二行。因为变量需要电话呼叫后,才有实际的值,变量会在电话接通后再执行TTS。非变量在流程加载的时候就可以预先执行TTS。
http文件 加一个前缀”(nohead=true,abs_cache_control=2147483647)“, 可以只下载一次,就永久缓存,如果http路径最后不是.wav或者.mp3指定文件格式的,需要(nohead=true,abs_cache_control=2147483647,ext=wav)用ext指定一下格式。文件格式尽量用wav,8000hz,16bit,单声道。
cti.conf.xml 这个配置要和tts的并发一样。预先TTS时,最多同时多少个线程调用TTS。
条件匹配顺序

用户说话,ASR返回识别结果 执行 文本 输入事件。注意 全局节点和流程子节点的优先级是统一排序的。
文本 关键词匹配
按照每个包含文本条件[箭头属性]的优先级匹配关键词、
知识库 关键词匹配
匹配节点关联的知识库
文本 ANY
无输入放音
完成 关键词匹配
如果完成输入是没检测到任何识别结果[timeout()],并且配置了无输入放音,执行无输入放音
未匹配放音
如果完成输入未匹配到关键词,并且配置了未匹配放音,执行未匹配放音
完成 ANY
未匹配超过最大次数,或者未设置未匹配放音,则执行ANY条件。 ANY条件优先级最低。
限制流程重复执行次数

知识库和流程节点,都可以配置重复执行次数,超过次数,则会跳过这个节点。为了防止死循环,默认最大可循环20次。
第二次进入节点,可以配置重放声音文件,就不会感觉机器人一样,重复播放一个文件了。
常用于挽回流程,举例 你需要吗 -> 不需要 -> 要不要在考虑一下 -> 好吧 ->这时候就跳转回“你需要吗这个节点”。 配置重复次数,可以防止一直循环,配置重放声音文件,第二次进入节点,可以播放一个不同的声音文件。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值