whisper-v3模型部署环境执行

本文介绍了如何在GitHub上安装WhisperV3大模型,涉及步骤如gitclone、依赖包安装。重点讨论了大模型中的弱标签概念及其在模型训练中的处理方法。通过实例展示了如何使用弱标签进行音频文件的转文本操作。
摘要由CSDN通过智能技术生成

1. 安装whisperV3

  1. github git clone https://github.com/openai/whisper.git
  2. pip install -U openai-whisper
  3. pip install setuptools-rust
    这些都没有安装 但是github下载的版本是能执行成功的
  4. pip install accelerate
  5. pip install soundfile
  6. pip install librosa
  7. pip install torchaudio

requirements.txt

numba
numpy
torch
tqdm
more-itertools
tiktoken
triton>=2.0.0,<3;platform_machine=="x86_64" and sys_platform=="linux" or sys_platform=="linux2"

github官方版本

要进到whisper目录里面, 执行脚本要和whisper/whisper目录同级。这样就执行成功了。

import whisper

model = whisper.load_model("base")
result = model.transcribe("audio.mp3")
print(result["text"])

遇到的名词解释

1. 大模型的弱标签

在大模型中,弱标签(Weak Labels)通常指的是相对于强标签(Strong Labels)而言的标签类型。强标签是指对每个样本都有明确、准确的标签,可以直接用于训练模型的监督学习任务。而弱标签则指的是对样本的标签信息不够准确或完整,可能存在噪声、不确定性或模糊性。

弱标签可以是多种形式,常见的包括但不限于:

  1. 部分标签(Partial Labels):只对样本的部分特征或属性进行标记,而不是对整个样本进行标记。
  2. 噪声标签(Noisy Labels):由于标注过程中的错误或不确定性而产生的标签。
  3. 不确定标签(Uncertain Labels):对于某些样本标签的确定性不高,存在一定程度的不确定性。
  4. 模糊标签(Ambiguous Labels):标签含义不明确或模糊,可能存在多种解释或理解。

在使用弱标签进行训练时,通常需要采取一些特殊的处理方法来处理标签的不确定性和噪声,以提高模型的鲁棒性和泛化能力。这包括使用弱标签推理(Weak Label Inference)、噪声过滤(Noise Filtering)、半监督学习(Semi-Supervised Learning)等技术来充分利用弱标签信息进行模型训练。

参考文档

论文: https://cdn.openai.com/papers/whisper.pdf
whisper-v3 model-card https://huggingface.co/openai/whisper-large-v3
知乎胡儿 v3介绍 https://zhuanlan.zhihu.com/p/662906303
安装参考 https://zhuanlan.zhihu.com/p/666969310
github https://github.com/openai/whisper/blob/main/model-card.md
根据官方文档安装就可以了 https://github.com/openai/whisper/blob/main/README.md
官网 https://openai.com/research/whisper

  • 8
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Whisper 是 Ethereum 的一种存储模块,可以用来在区块链上发送点对点的消息。它可以在本地部署在 Geth 上,你需要先安装 Geth。 安装完 Geth 之后,你需要在启动 Geth 时使用 `--shh` 参数来启用 Whisper。 示例: ``` geth --shh ``` 你还可以指定 Whisper 的相关配置,如使用的端口等。 示例: ``` geth --shh --shh.port "30311" ``` 在 Geth 启动后,你就可以通过 Geth 控制台来使用 Whisper。如需使用 whisper API 你需要在合约上或通过web3 provider 调用。 有关 Whisper 部署和使用的更多信息,可以参考官方文档: https://github.com/ethereum/wiki/wiki/Whisper ### 回答2: "Whisper"是一个信息传输和存储协议,可以用于在去中心化网络中进行点对点通信。本地部署指的是将这个协议部署在本地环境中,而不是在云端平台或任何其他远程服务器上运行。 将Whisper协议本地部署的优势在于: 1. 隐私和安全:由于信息传输和存储发生在本地环境中,用户更有信心和控制自己的数据。本地部署可以减少第三方获取用户通信内容和元数据的风险。 2. 性能和延迟:由于Whisper协议本地运行,它不需要经过远程服务器的中转和处理,从而减少了通信的延迟。这对于需要实时交流的应用非常重要。 3. 定制和灵活性:本地部署意味着可以根据特定需求进行自定义配置和调整。这样,用户可以根据自己的偏好和需求对Whisper进行更灵活的配置。 然而,Whisper本地部署也存在一些挑战和限制: 1. 需要自行管理和维护:本地部署意味着需要用户自行负责Whisper协议的安装、配置和维护。这可能需要一些技术知识和资源来确保系统的正常运行。 2. 可能存在硬件要求:有些本地部署可能需要特定的硬件设备或网络设置来确保Whisper的顺利运行。这可能限制了某些用户或组织的选择。 总体而言,Whisper的本地部署为需要更大控制权和定制能力的用户提供了一个可选方案。通过本地部署,用户可以更好地保护隐私、提高性能,并根据自己的需求进行灵活配置。然而,也需要考虑到管理和维护的挑战,以及可能存在的硬件限制。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值