视频-音频-文字

最新推荐文章于 2024-05-06 20:44:37 发布

lucky i wanna

最新推荐文章于 2024-05-06 20:44:37 发布

阅读量330

点赞数

分类专栏： python ffmpy3 speech_recognition

本文链接：https://blog.csdn.net/qq_38650447/article/details/103795859

版权

python 同时被 3 个专栏收录

9 篇文章 0 订阅

订阅专栏

ffmpy3

1 篇文章 0 订阅

订阅专栏

speech_recognition

1 篇文章 0 订阅

订阅专栏

视频-音频

第一步，安装ffmpy3库。

pip install ffmpy3

第二步，下载FFmpeg。

去官网下载FFmpeg，根据自身电脑版本下载相应安装包。

http://ffmpeg.org/download.html

解压ffmpeg文件，将ffmpeg文件中的可执行文件ffmpeg.exe复制到当前项目文件目录下。

第三步，运行以下代码生成wav文件。

from ffmpy3 import FFmpeg

changefile = r'123.mp4'   #后缀不需要MP4
outputfile = r'123.wav'  #后缀一定要wav
ff = FFmpeg(
    inputs={changefile: None},
    outputs={outputfile: '-vn -ar 44100 -ac 2 -ab 192 -f wav'}
)
print(ff.cmd)
ff.run()

音频-文字

第一步，申请IBM账号。可以参考这篇博客。

https://blog.csdn.net/weixin_34302561/article/details/89696860

注意：现在申请完之后，可能不会出现username和password，而是会出现API 密钥和URL。

第二步，安装speech_recognition库。

pip install speech_recognition

第三步，运行以下代码生成txt文件。

import speech_recognition as sr

r = sr.Recognizer()
with sr.WavFile("123.wav") as source:  # 请把引号内改成你自己的音频文件路径
    audio = r.record(source)

    IBM_USERNAME = "apikey"
    IBM_PASSWORD = 'yourapikey' #输入自己申请的apikey

    text = r.recognize_ibm(audio, username=IBM_USERNAME, password=IBM_PASSWORD, language='en-US')

    with open('data.txt', 'w') as f:  # 设置文件对象
        f.write(text)
    print(text)

ar-AR 阿根廷语
en-UK 英式英语
en-US 美式英语
es-ES 西班牙语
fr-FR 法语
ja-JP 日语
pt-BR 巴西葡萄牙语
zh-CN 中文

注意每个人每个月500分钟免费，30天不活跃免费服务将删除。

lucky i wanna

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
视频-音频-文字

视频-音频第一步，安装ffmpy3库。pip install ffmpy3第二步，下载FFmpeg。去官网下载FFmpeg，根据自身电脑版本下载相应安装包。http://ffmpeg.org/download.html解压ffmpeg文件，将ffmpeg文件中的可执行文件ffmpeg.exe复制到当前项目文件目录下。第三步，运行以下代码生成wav文件。from ...
复制链接

扫一扫