speech开源框架_iOS10语音识别框架SpeechFramework应用详解

最新推荐文章于 2022-04-16 22:50:14 发布

Kamyir

最新推荐文章于 2022-04-16 22:50:14 发布

阅读量368

点赞数

文章标签： speech开源框架

本文链接：https://blog.csdn.net/weixin_31319027/article/details/112813208

版权

本文详细介绍了iOS10中引入的SpeechFramework，该框架使得开发者能够轻松实现语音识别功能，无需依赖第三方服务。文章涵盖SFSpeechRecognizer、SFSpeechRecognitionTask等关键类的用法，包括权限申请、语音识别请求和结果处理。同时，讨论了SFSpeechRecognitionResult类中的识别信息结构。注意，SpeechFramework在模拟器上可能无法正常工作。

摘要由CSDN通过智能技术生成

摘要: iOS10语音识别框架SpeechFramework应用

一、引言

iOS10系统是一个较有突破性的系统，其在Message，Notification等方面都开放了很多实用性的开发接口。本篇博客将主要探讨iOS10中新引入的SpeechFramework框架。有个这个框架，开发者可以十分容易的为自己的App添加语音识别功能，不需要再依赖于其他第三方的语音识别服务，并且，Apple的Siri应用的强大也证明了Apple的语音服务是足够强大的，不通过第三方，也大大增强了用户的安全性。

二、SpeechFramework框架中的重要类

SpeechFramework框架比较轻量级，其中的类并不十分冗杂，在学习SpeechFramework框架前，我们需要对其中类与类与类之间的关系有个大致的熟悉了解。

SFSpeechRecognizer：这个类是语音识别的操作类，用于语音识别用户权限的申请，语言环境的设置，语音模式的设置以及向Apple服务发送语音识别的请求。

SFSpeechRecognitionTask：这个类是语音识别服务请求任务类，每一个语音识别请求都可以抽象为一个SFSpeechRecognitionTask实例，其中SFSpeechRecognitionTaskDelegate协议中约定了许多请求任务过程中的监听方法。

SFSpeechRecognitionRequest:语音识别请求类，需要通过其子类来进行实例化。

SFSpeechURLRecognitionRequest：通过音频URL来创建语音识别请求。

SFSpeechAudioBufferRecognitionRequest:通过音频流来创建语音识别请求。

SFSpeechRecognitionResult：语音识别请求结果类。

SFTranscription：语音转换后的信息类。

SFTranscriptionSegment：语音转换中的音频节点类。

了解了上述类的作用于其之间的联系，使用SpeechFramework框架将十分容易。

三、申请用户语音识别权限与进行语音识别请求

开发者若要在自己的App中使用语音识别功能，需要获取用户的同意。首先需要在工程的Info.plist文件中添加一个Privacy-Speech Recognition Usage Description键，其实需要对应一个String类型的值，这个值将会在系统获取权限的警告框中显示，Info.plist文件如下图所示：

使用SFSpeechRecognize类的requestAuthorization方法来进行用户权限的申请，用户的反馈结果会在这个方法的回调block中传入，如下：

//申请用户语音识别权限

[SFSpeechRecognizer requestAuthorization:^(SFSpeechRecognizerAuthorizationStatus status) {

}];

SFSpeechRecognizerAuthorzationStatus枚举中定义了用户的反馈结果，如下：

typedef NS_ENUM(NSInteger, SFSpeechRecognize