关于python 语音转字幕,字幕转语音大杂烩

文字转语音

Python语音合成之第三方库gTTs/pyttsx3/speech横评(内附使用方法)_python_脚本之家

代码示例

 from gtts import gTTS
 tts = gTTS('你好你在哪儿!',lang='zh-CN')
 tts.save('hello.mp3')
 import pyttsx3
 engine = pyttsx3.init() #创建对象
 """语速"""
 rate = engine.getProperty('rate') #获取当前语速的详细信息
 print(rate) #打印当前语速
 engine.setProperty('rate',200) #重设语速
  engine.say('Hello world!')
  engine.say('My current speaking rate is '+str(rate))
  engine.runAndWait()
 engine.stop()
 engine.save_to_file('你好,世界!明天你要去哪儿玩','test.mp3')
 engine.runAndWait()

相比之下gtts播报效果好一些,局限新大点,pyttsx3出了播报效果差点其他还行,灵活性比较好

语音转字幕,用的是whisper

whisper现有还不错的语音识别,里面有很多模型,看网上很多教程写的很杂,很蒙。此处简化操作。

import whisper
whisper_model = whisper.load_model("tiny")
result = whisper_model.transcribe(r"D:\xy_fs_try\video_to_deal\audio_realize\hello.mp3")
print(", ".join([i["text"] for i in result["segments"] if i is not None]))

此处需要安装ffmpeg ,不知道安装方法的自己去搜索。此处还有坑就是安装torch的问题,卸载原有的torch 安装一下命令即可

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值