MFC使用Google Speech API进行语音识别

本文介绍了如何在MFC项目中利用Google Speech API进行语音识别。作者分享了自己的实践过程,强调了AMR文件格式在语音识别中的优势,以及在处理AMR文件时需要注意的二进制读取和NUL字符问题。通过调试和正确组装数据,可以成功实现语音识别功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这段时间需要做个语音识别的程序,由于时间和能力有限,所以不大可能自己做一个识别引擎,怎么办呢,当然是查看度娘了。

这才发现网上其实有很多的解决方案,最出名的莫过于APPLE SIRI 以及GOOGLE NOW这两个识别引擎,GOOGLE NIOW已经在自己的安卓手机上进行了无数次测试,怎么说呢,这识别率简直是爆表啊,就算不是标准普通话,就像我这种川普也是没有问题的;少年你这么猛,你家人知道么生气

操作之前当然要去看看大神们的研究成果啦,我这里就不说原理了,大家转到这里去看看原帖点击打开链接找不到连接就看这里http://blog.csdn.net/dlangu0393/article/details/7214728

这里由于楼主以前是搞通信的,所以文件采用amr格式,这东西好啊,压缩率高,专门用来传输人声的,效果很赞哦,关键是还能滤掉杂音,可以提高识别率(自我安慰)

废话说了这么多!上代码

int CGoogleNowDlg::PostGoogleAPI()
{
	char sendata[65536]={0};
	SOCKET sock = ::socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
	if (sock &
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值