实时语音识别(Python+HTML实战)

项目下载地址:FunASR

1 安装库文件

项目提示所需要下载的库文件:pip install -U funasr 和 pip install modelscope

运行过程中,我发现还需要下载以下库文件才能正常运行:

下载:pip install websockets,pip install ffmpeg

2 运行 .py 文件

运行 FunASR-main/runtime/python/websocket/funasr_wss_server.py 文件,加载模型

注:如果提示缺少什么模型,就 pip 下载什么模型

部署本地的情况下需要修改默认 host 值 "0.0.0.0" 为 "127.0.0.1":

  • --host:是 FunASR runtime-SDK 服务部署机器的 ip,默认为本机 ip(127.0.0.1),如果 client 与服务不在同一台服务器,需要改为部署机器 ip
  • --port:10095 是部署的端口号

成功运行结果如下: 

.cache\modelscope\hub\iic\speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch\model.pt

.cache\modelscope\hub\iic\speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online\model.pt

.cache\modelscope\hub\iic\speech_fsmn_vad_zh-cn-16k-common-pytorch\model.pt

.cache\modelscope\hub\iic\punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727\model.pt

 提示如下内容,说明模型已经加载完毕:

3 运行 .html 文件 

运行 FunASR-main/runtime/html5/static/index.html 文件,加载项目主页面

第一个 asr 服务器的地址填入:

wss://127.0.0.1:10095

点击左下角的连接按钮,回到 Pycharm 运行界面提示连接成功!

4 结果展示

该项目支持麦克风实时录音功能,同时可以传入多种音频格式的文件(如 .wav, .pcm, .mp3 等),也支持视频输入(如 .mp4 等),以及多文件列表 wav.scp 输入。

  • 24
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
深度学习-语音识别是一种利用神经网络模型进行语音识别的技术。Python语言在深度学习领域有广泛应用,并提供了多个相关框架,如TensorFlow和PyTorch,便于实现语音识别任务。 在进行深度学习-语音识别实战时,首先需要准备语音数据集。可以使用已有的公开数据集,也可以自己收集。常用的数据集包括LibriSpeech、TIMIT和Aurora4等。 接下来,需要将语音数据集进行预处理。预处理步骤包括数据清洗、标签处理和特征提取。数据清洗可以剔除噪音和异常数据,标签处理主要是将语音数据与对应的文字标签进行对齐,特征提取则是将语音信号转换为机器学习算法可以处理的数值特征,常用的特征提取方法有Mel频谱特征和MFCC等。 然后,需要选择合适的神经网络模型进行语音识别。常用的模型包括基于卷积神经网络(CNN)和循环神经网络(RNN)的混合模型。模型的选择要根据数据集的规模和任务需求进行。 在实际实现中,可以利用Python的深度学习框架(如TensorFlow和PyTorch)来构建和训练神经网络模型。框架提供了高级的API和函数,可以方便地定义模型结构、进行参数优化和模型评估。 训练完成后,可以使用训练好的模型进行语音识别。使用Python进行语音识别时,可以使用语音信号进行预测,并得到相应的文本结果。 总之,深度学习-语音识别实战是一个复杂的任务,但借助Python的强大生态系统和深度学习框架,可以更高效地进行模型训练和识别任务的实现。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

瑞雪兆我心

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值