基于funasr+pyaudio实现电脑本地麦克风实时语音识别项目语音转文本python实现

FL1623863129

已于 2024-07-29 10:30:15 修改

阅读量89

点赞数 1

分类专栏： Python 深度学习文章标签：语音识别人工智能

于 2024-07-29 10:21:11 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/FL1623863129/article/details/140764071

版权

Python 同时被 2 个专栏收录

193 篇文章 11 订阅

订阅专栏

140 篇文章 18 订阅

订阅专栏

【框架地址】

https://github.com/modelscope/FunASR

【简单介绍】

FunASR是一个功能全面的语音识别工具包，支持多种预训练模型的推理和微调，提供高精度和高效能的语音识别服务。结合PyAudio库，可以实现电脑本地麦克风实时语音识别项目。

该项目首先通过PyAudio库捕获麦克风输入的音频数据，PyAudio是一个跨平台的音频I/O库，可以方便地访问麦克风等音频设备。捕获的音频数据经过预处理，包括降噪、去除回声等，以提高识别准确率。

随后，使用FunASR中的实时语音识别模型（如Paraformer-zh-streaming）对预处理后的音频数据进行处理。这些模型能够实时地将音频数据转换为文本信息，支持中文等多语言识别。

在识别过程中，FunASR还提供了语音端点检测（VAD）功能，自动检测语音片段的开始和结束，以提高识别效率。同时，还可以添加标点恢复（PR）功能，为识别结果添加标点符号，提升可读性。

最终，识别结果会实时显示在界面上，用户可以通过界面实时查看和编辑识别结果。整个项目流程简洁高效，为实时语音识别应用提供了有力支持。

【测试环境】

anaconda3+python3.9

torch==2.0.1+cu117

funasr==1.1.4

modelscope==1.16.1

PyAudio ==0.2.14

【调用代码】

from FunasrManager import *
fm = FunasrManager()
fm.start()
while True:
    time.sleep(0.2)

【视频演示】

基于funasr+pyaudio实现电脑本地麦克风实时语音识别项目语音转文本python实现_哔哩哔哩_bilibili【测试环境】anaconda3+python3.9torch==2.0.1+cu117funasr==1.1.4modelscope==1.16.1PyAudio ==0.2.14更多信息参考：https://blog.csdn.net/FL1623863129/article/details/140764071, 视频播放量 1、弹幕量 0、点赞数 0、投硬币枚数 0、收藏人数 0、转发人数 0, 视频作者未来自主研究中心, 作者简介未来自主研究中心，相关视频：和阿宝去黑子家玩儿咯，【全站最全SD教程】零基础入门到精通SD教程附带秋叶大神Stable Diffusion安装包人工智能AIGC绘图 AI绘图一键出，开源免费的FunASR实时语音识别模型，手把手教你部署和使用，yolox+bytetrack+pyqt5实现目标追踪结果演示，基于yolo-nas+deepsort实现目标追踪视频演示，跪了！GitHub标星122K！！百星仓库—程序界的封神之作 project based learning，自学编程学习指南！，基于tkinter的GUI选择图片选择视频选择摄像头，将yolov8封装成一个类几行代码完成语义分割任务，[暑假大作战]永久免费的云电脑，使用yolov7的onnx模型部署在C#的winform界面开发程序上https://www.bilibili.com/video/BV1Pb42177Bw/?vd_source=989ae2b903ea1b5acebbe2c4c4a635ee 【源码下载】

https://download.csdn.net/download/FL1623863129/89593855

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
基于funasr+pyaudio实现电脑本地麦克风实时语音识别项目语音转文本python实现

【代码】基于funasr+pyaudio实现电脑本地麦克风实时语音识别项目语音转文本python实现。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

FL1623863129 你的打赏是我写文章最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。