视频-音频-文字

视频-音频

第一步,安装ffmpy3库。

pip install ffmpy3

第二步,下载FFmpeg。

 去官网下载FFmpeg,根据自身电脑版本下载相应安装包。

http://ffmpeg.org/download.html

解压ffmpeg文件,将ffmpeg文件中的可执行文件ffmpeg.exe复制到当前项目文件目录下。

第三步,运行以下代码生成wav文件。

from ffmpy3 import FFmpeg

changefile = r'123.mp4'   #后缀不需要MP4
outputfile = r'123.wav'  #后缀一定要wav
ff = FFmpeg(
    inputs={changefile: None},
    outputs={outputfile: '-vn -ar 44100 -ac 2 -ab 192 -f wav'}
)
print(ff.cmd)
ff.run()

音频-文字

第一步,申请IBM账号。可以参考这篇博客。

https://blog.csdn.net/weixin_34302561/article/details/89696860

注意:现在申请完之后,可能不会出现username和password,而是会出现API 密钥和URL。

第二步,安装speech_recognition库。

pip install speech_recognition

第三步,运行以下代码生成txt文件。

import speech_recognition as sr

r = sr.Recognizer()
with sr.WavFile("123.wav") as source:  # 请把引号内改成你自己的音频文件路径
    audio = r.record(source)

    IBM_USERNAME = "apikey"
    IBM_PASSWORD = 'yourapikey' #输入自己申请的apikey

    text = r.recognize_ibm(audio, username=IBM_USERNAME, password=IBM_PASSWORD, language='en-US')

    with open('data.txt', 'w') as f:  # 设置文件对象
        f.write(text)
    print(text)
  • ar-AR 阿根廷语
  • en-UK 英式英语
  • en-US 美式英语
  • es-ES 西班牙语
  • fr-FR 法语
  • ja-JP 日语
  • pt-BR 巴西葡萄牙语
  • zh-CN 中文

注意每个人每个月500分钟免费,30天不活跃免费服务将删除。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值