【whisper】使用whisper实现语音转文字

rhythmcc

已于 2024-09-01 16:31:17 修改

阅读量37

点赞数 1

文章标签： whisper

于 2024-09-01 15:28:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xudawu201/article/details/141784723

版权

whisper需要ffmpeg支持
官网下载ffmpeg

https://www.gyan.dev/ffmpeg/builds/

在这里插入图片描述
下载完毕后解压放到合适的位置

添加环境变量

在cmd中输入以下

ffmpeg -version

出现下面结果代表成功
在这里插入图片描述
安装whisper

pip install openai-whisper

在vscode中运行
在这里插入图片描述
测试代码

import whisper

if __name__ == '__main__':
    # 加载模型
    model = whisper.load_model("large")
    audio_path = 'Asset2021_10_23\\test_audio_2024_09_01.aac'
    result = model.transcribe(audio_path, fp16=True, language="Chinese")
    print(result["text"])

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
【whisper】使用whisper实现语音转文字

whisper需要ffmpeg支持。下载完毕后解压放到合适的位置。官网下载ffmpeg。出现下面结果代表成功。在vscode中运行。
复制链接

扫一扫

rhythmcc CSDN认证博客专家 CSDN认证企业博客

码龄7年

39: 原创

3万+: 周排名

5万+: 总排名

3万+: 访问

: 等级

489: 积分

79: 粉丝

96: 获赞

5: 评论

77: 收藏

私信

关注

热门文章

最新评论

python安装下载到本地的包
CSDN-Ada助手: 恭喜您发布了第16篇博客！学习如何在Python中安装下载到本地的包是一个很实用的技能。希望您能继续坚持创作，分享更多有趣的内容。下一步可以考虑深入探讨如何使用这些包解决实际问题，或者分享一些自己的编程经验和心得体会。期待您的下一篇博客，加油！
pytorch搭建简单神经网络实现y=sin(x)函数拟合
weixin_43936635: 您好！测试了您的代码，这里提一些问题。 1.神经网络没有加激活函数。 2.代码57~73行（尤其第59行），这一段每次只使用一个数据训练，应该用成组数据训练，把整个循环替换为loss=criterion(nn_Net(x_tensor),y_tensor)+反向传播三行。 3.最后测试训练效果使用finalx_list=x_tensor.tolist(),finaly_list=nn_Net(x_tensor).tolist()，即输入所有X，获得所有预测值，而不是在训练中每更新一次网络后保留一个数据（代码77、78行）。由于没有激活函数，最后得到的预测曲线是一条直线。
python安装PyQt6和找到designer.exe
极简小灵: 文章非常好，解决了我的问题
matlab使用简单神经网络实现函数逼近
rhythmcc: 分别乘权重+偏置值后再累加起来，(x1*w1+b1）+（x2*w2+b2)，每个隐藏层的单个神经元结点的权和偏置值与输入特征数相同，这里有x1和x2，则每个结点w和b也有两个
matlab使用简单神经网络实现函数逼近
肖戈兀: 请问如果有两个变量，x1、x2，应该怎么写？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

rhythmcc 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。