freeswitch 科大讯飞、百度的语音识别(asr、tts) 参考

freeswitch 科大讯飞 语音识别(asr) 具体参考:

(如果你觉得实现下面麻烦可以到 https://item.taobao.com/item.htm?id=620078442889哦)

https://github.com/wangkaisine/mrcp-plugin-with-freeswitch/blob/master/README.md

1.asr写的很详细

2.tts使用方式

<extension name="unimrcp"> 
<condition field="destination_number" expression="^8520$">  

<action application="answer"/>

<action application="set" data="tts_engine=unimrcp:unimrcpserver-mrcp2"/>
 <action application="set" data="tts_voice=awb"/>
 <action application="sleep" data="500"/> 

 <action application="speak" data="李林您好我爱你"/>

 <action application="sleep" data="500"/> 
 <action application="lua" data="names.lua"/>
 </condition> </extension>

百度识别请参考https://ai.baidu.com/docs#/BICC-ASR-MrcpServer/top

创建应用注意权限

 

以上是基于unimrcp 的实现

以下基于mod_pocketsphinx 模块实现  主要实现switch_asr_interface_t 接口 

(如果你觉得实现麻烦可以到 https://item.taobao.com/item.htm?id=620078442889哦)

 此方式可以自定义控制 还可以对识别的pcm播放

  

测试

<extension name="asr">
      <condition field="destination_number" expression="^88888$">
        <action application="answer"/>
        <action application="log" data="===begin=="/>
        <action application="sleep" data="2000"/>
        <action application="log" data="ERR ===begin=="/>
        <action application="play_and_detect_speech" data="/usr/local/freeswitch/sounds/2.wav detect:pocketsphinx yes_no"/>
        <action application="log" data="===${detect_speech_result}"/> 
        <action application="sleep" data="2000"/>
      </condition>
    </extension>
play_and_detect_speech 如果播放声音不好的就播放个1s 静音 在次之前播放吧
效果

 

(如果你觉得实现麻烦可以到 https://item.taobao.com/item.htm?id=620078442889哦)

对此感兴趣的可以加群261074724 

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值