鸿蒙开发进阶（HarmonyOS）实时语音识别

你我皆是牛马星人

已于 2024-11-20 14:41:17 修改

阅读量1.3k

点赞数 13

分类专栏：鸿蒙开发 HarmonyOS OpenHarmony 文章标签： harmonyos 华为 android ui 鸿蒙前端语音识别

于 2024-11-06 15:40:04 首次发布

本文链接：https://blog.csdn.net/adaedwa187545/article/details/143571466

版权

鸿蒙NEXT开发实战往期必看文章：

一分钟了解”纯血版！鸿蒙HarmonyOS Next应用开发！

“非常详细的” 鸿蒙HarmonyOS Next应用开发学习路线！（从零基础入门到精通）

HarmonyOS NEXT应用开发案例实践总结合（持续更新......）

HarmonyOS NEXT应用开发性能优化实践总结（持续更新......）

前言

HarmonyOSNext中集成了强大的AI功能。Core Speech Kit（基础语音服务）是它提供的众多AI功能中的一种。

Core Speech Kit（基础语音服务）集成了语音类基础AI能力，包括文本转语音（TextToSpeech）及语音识别（SpeechRecognizer）能

力，便于用户与设备进行互动，实现将实时输入的语音与文本之间相互转换。

简单来讲Core Speech Kit主要提供了两大语音AI功能：

语音识别
文本转语音

语音识别介绍

语音识别功能可以将一段音频信息（短语音模式不超过60s，长语音模式不超过8h）转换为文本。

其中语音识别又可以实现：

实时语音转文本
声音文件转文本

实时语音转文本

实现流程

先介绍语音识别的流程，后面的文字转语音大同小异

申请权限
创建AI语音引擎
设置监听回调
开始监听

tips: 完整代码在每一个功能的末尾，可以结合封装后的代码来阅读

申请权限

因为在开发功能过程中，需要调用手机的麦克风功能。所以需要主动申请权限。

申请权限分成3个步骤

声明权限
检查是否拥有权限
申请权限

声明权限

在\entry\src\main\module.json5中添加以下配置代码 requestPermissions

{
  "module": {
    ...
    "requestPermissions": [
      {
        "name": "ohos.permission.MICROPHONE",
        "reason": "$string:voice_reason",
        "usedScene": {
          "abilities": [
            "FormAbility"
          ],
          "when": "always"
        }
      }
    ],
  }
}