在嵌入式处理器Jetson Orin上使用Whisper做语音内容识别

u013250861

于 2025-05-01 22:45:32 发布

阅读量73

点赞数

分类专栏： # LLM/部署&推理文章标签： whisper

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/147656689

版权

LLM/部署&推理专栏收录该内容

69 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

简介

在AI大语言模型逐渐兴起的时代，或许在特定的领域需要离线、免费、开源的语音处理应用方式。选来选去也就只能用whisper了。鉴于网上其它参考方案都是基于PC端的N卡的Demo，就目前（20231116）而言还没有看到关于嵌入式上的应用方式，文档太少了。其中遇到的问题可谓千奇百怪，接下来几篇内容将大致列出部署过程及遇到的问题如何应对。因为各个环境存在一些差异，具体还是按实际情况解决实际问题。

由于jetson诞生到至今，应用领域都是视频识别之类的内容多一些，对于语音上的应用很少。没有找到什么案例，只能自己科普，然后照葫芦画瓢了。

科普

在此之前，我们一般会参考一下目前PC端的实现方式，以及可行性分析。先看看网上一些文章吧，比如：Linux 中的机器学习：Whisper——自动语音识别系统。看着也没问题，装个软件运行起来即可，其中包括python的

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。