MaxCode-1
这个作者很懒,什么都没留下…
展开
-
如何从0到1本地搭建whisper语音识别模型
Whisper 是 OpenAI 发布的一个强大的语音识别模型,它可以将语音转换为文本,支持多语言输入,并且可以处理各种音频类型。确保你安装的 PyTorch 支持 CUDA,并在运行 Whisper 时使用 GPU 进行推理。Whisper 是开源的,你可以通过 OpenAI 的 GitHub 来获取。Whisper 提供了不同大小的模型,模型越大,精度越高,但需要更多的内存。根据你的需求和硬件资源,可以选择不同大小的模型。Whisper 可以用于实时语音转录,但需要自己开发相应的接口,处理实时音频流。原创 2024-09-06 10:27:17 · 437 阅读 · 0 评论 -
本地部署whisper模型(语音转文字)
Whisper是 OpenAI 2022年发布的一款语音预训练大模型,集成了多语种ASR、语音翻译、语种识别的功能。Whisper使用弱监督训练的方法,可以直接进行多任务的学习。原创 2024-01-31 10:15:20 · 3006 阅读 · 0 评论 -
OpenVoice文本转语音大模型原理
即时语音克隆(IVC)-- Instant voice cloning文本转语音(TTS)-- text-to-speech给定参考说话者的短音频样本的情况下克隆任何参考说话者的声音,而无需对参考说话者进行额外培训。它也被称为零样本TTS。IVC使用户能够灵活定制生成的声音,在各种真实世界应用中展现了巨大的价值,如媒体内容创作、定制聊天机器人以及人与计算机或大型语言模型之间的多模态交互。原创 2024-01-31 09:50:19 · 459 阅读 · 0 评论 -
OpenVoice文本转语音大模型实战部署
把snakers4_silero-vad解压到/root/.cache/torch/hub目录下。修改openvoice_app.py文件,添加multiselect=True。解压到OpenVoice目录下。原创 2024-01-31 09:45:03 · 1062 阅读 · 0 评论 -
文本文件自动计算生成srt字幕格式的文件
根据txt文本文件自动计算生成大致srt字幕格式的文件,方便导入到剪映中一键生成配音。原创 2023-07-07 17:14:23 · 844 阅读 · 0 评论 -
剪映自动识别的.json字幕转.vtt格式
剪映自动识别的.json字幕转.vtt格式。原创 2023-07-07 17:05:13 · 918 阅读 · 0 评论 -
剪映字幕通过脚本实现自动打轴
从剪映获取字幕,同时可以依据剪映字幕实现脚本字幕的自动打轴。原创 2023-07-07 16:49:43 · 619 阅读 · 0 评论 -
快速创建剪映草稿
【代码】快速创建剪映草稿。原创 2023-07-07 16:44:55 · 1561 阅读 · 4 评论 -
在本地环境搭建gpt项目
忽略不能写Docker是一个开源的容器化平台,它可以帮助开发者和运维人员轻松地构建、打包和部署应用程序。使用Docker,您可以将应用程序及其所有依赖项打包到一个称为容器的独立单元中,使其可以在不同的环境中快速、可靠地运行。为了开始使用Docker,首先需要安装Docker引擎。下面是安装Docker的步骤:1.打开终端或命令提示符,并执行以下命令来更新软件包管理器:2.安装Docker的前提是系统要求支持64位架构,并且内核版本在3.10以上。原创 2023-06-07 14:39:02 · 1510 阅读 · 1 评论