一种为MP3生成字幕文件的方法

本文介绍了如何利用IBM Watson Speech to Text服务为MP3文件生成字幕。通过C#编写的工具,首先上传MP3文件进行识别,然后加载英文原文,最后匹配并生成字幕文件,支持.lrc和.smi格式。
摘要由CSDN通过智能技术生成

在云计算、大数据和人工智能如此火爆的当下,各种提供语音识别的云服务层出不群。近日,尝试制作了基于IBM Watson Speech to Text service辅助生成英语MP3字幕文件的工具,觉得还不错,特共享如下。

工具使用C#编制,具体思路如下:

第1步,使用内嵌的WebBrowser访问IBM有关服务网站:https://speech-to-text-demo.ng.bluemix.net/,界面如下方所示:


在该步骤下,需要手动点击网页的“Upload Audio File”按钮选择上传要配字幕的MP3音频文件。上传成功后,网站即开始自动识别过程。等到识别完成后,还需要手动点击下方的Word Timings and Alternatives,即可看到按顺序识别到的单词及对应的开始时刻。

注:(1)界面上方的保存按钮,可以将识别后的网页内容保存成本地htm文件,下一次可点击载入按钮直接载入,而无需重复识别过程。

(2)当点击界面下方的“下一步”按钮时,程序会自动扫描网页内容,生成由单词和时刻信息组成的单词时刻字典列表,这里记作lstDict,其类型为List<KeyValuePaire<

  • 3
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值