语音革命：打造您的个人AI助手，悄悄分享我的开源语音识别全攻略！

最新推荐文章于 2025-04-28 22:01:42 发布

爱编程的鼠鼠

最新推荐文章于 2025-04-28 22:01:42 发布

阅读量1k

点赞数 21

分类专栏： Dotnet Article 文章标签：人工智能语音识别

本文链接：https://blog.csdn.net/2301_81588941/article/details/135711355

版权

在AI智能化时代，人工智能助手不仅提高了我们的工作效率，而且变得越来越人性化。我的AI助手在此基础上又增添了一个引人瞩目的新功能——语音识别。在本文中，我将详细讲解如何在.Net环境下实现这一功能，并且分享自己的开源项目，让更多的开发者可以学习并应用到自己的项目中去。

以下是相关的2篇文章，语音的加持可以让我们的AI助手能力倍增。

为了完成这个任务，我们将使用到两个主要库：**NAudio **和 Whisper.net。

NAudio是一款由 Mark Heath 编写的开源.NET音频库。它具备非常丰富的功能：

支持多API的音频播放，比如WaveOut、DirectSound、ASIO、WASAPI等；+ 读取多种标准文件格式，包括WAV、AIFF、MP3等；+ 在不同的音频格式间转换，修改通道数，改变位深度，重采样等；+ 使用计算机上安装的任何ACM或Media Foundation编解码器来编码音频；+ 创造MP3、AAC/MP4音频、WMA文件等；+ 采用32位浮点混音引擎进行音频流的混合和操作；+ 提供全面的MIDI事件模型支持；+ 可扩展的编程模型，易于自定义组件的添加。

详细功能和API使用可以在它的GitHub页面上找到：

https://github.com/naudio/NAudio

Whisper.net是开源的Whisper .net绑定，利用了whisper.cpp的能力。它为.NET提供了OpenAI Whisper的功能，以便开发人员可以轻松实现语音到文本的转换。此库的GitHub地址为：

https://github.com/sandrohanea/whisper.net

PM> Install-Package NAudio.Core
PM> Install-Package Whisper.net
PM> Install-Package Whisper.net.Runtime

2、实现语音功能

首先，我们需要使用如下模型：

ggml-base-q5_1.bin

进行依赖注入：

Locator.CurrentMutable