IOS中实现语音识别

最新推荐文章于 2022-12-19 01:38:15 发布

SoEasy_

最新推荐文章于 2022-12-19 01:38:15 发布

阅读量3.5k

点赞数

分类专栏： ios 语音识别文章标签： ios 语音识别开源 google 源码

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/oChunCui1/article/details/17324673

版权

通过谷歌语音接口的实现语音识别

最近在项目中有需要实现语音识别的功能。折腾了几天才搞好。刚开始做的时候没点头绪，网上找的资料都是乱七八糟的，要不就是非常古老的实现方法，一些简单的代码片段。所以我决定把我的经验分享给大家。

要在IOS中实现语音识别流程如下:

录音->pcm格式->转换wav->转换flac->向谷歌发送请求->等待返回的json数据->解析数据;

首先如果你要使用谷歌的接口实现语音识别必须知道下面着几点：

1.如何发送POST请求。(可以使用开源库ASIHttpRequest，AFNetWorking，这些库都封装了网络请求，使用起来非常简单);

2.了解音频格式pcm,wav,flac，(着三个音频格式的关系是，因为谷歌接口只接受flac音频格式，其他格式无法识别,IOS中无法录制flac音频格式,也无法录制wav,只能录制pcm,所以要一步一步转换);

3.了解AVAudioRecorder类如何使用，怎么配置.

在IOS中录音就要使用AVAudioRecorder这个类,这个类的实例方法如下:

- (id)initWithURL:(NSURL *)url settings:(NSDictionary *)settings error:(NSError **)outError;
url:录音完成后声音存放的位置,

settings:设置录制声音的参数，只有一个关键的key跟大家讲下AVFormatIDKey，这个key决定你录制出来声音的格式,我们要录成lpcm格式,未压缩的原音数据,以便我们转换,所以使用kAudioFormatLinearPCM值.其他key可以在帮助文档看,

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
9
评论
IOS中实现语音识别

最近在项目中有需要实现语音识别的功能。折腾了几天才搞好。刚开始做的时候没点头绪，网上找的资料都是乱七八糟的，要不就是非常古老的实现方法，一些简单的代码片段。所以我决定把我的经验分享给大家。本文不会有完整的代码，只会出现关键性代码。一些思路。首先如果你要使用谷歌的接口实现语音识别必须知道下面着几点：1.如果发送POST请求。(可以使用开源库ASIHttpRequest，AFNetW
复制链接

扫一扫

专栏目录

评论 9

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。