一种为MP3生成字幕文件的方法

最新推荐文章于 2025-03-26 15:10:17 发布

alvin_2005

最新推荐文章于 2025-03-26 15:10:17 发布

阅读量1.8w

点赞数 3

分类专栏：我的宝贝 .net 语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/alvin_2005/article/details/80935531

版权

本文介绍了如何利用IBM Watson Speech to Text服务为MP3文件生成字幕。通过C#编写的工具，首先上传MP3文件进行识别，然后加载英文原文，最后匹配并生成字幕文件，支持.lrc和.smi格式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在云计算、大数据和人工智能如此火爆的当下，各种提供语音识别的云服务层出不群。近日，尝试制作了基于IBM Watson Speech to Text service辅助生成英语MP3字幕文件的工具，觉得还不错，特共享如下。

工具使用C#编制，具体思路如下：

第1步，使用内嵌的WebBrowser访问IBM有关服务网站：https://speech-to-text-demo.ng.bluemix.net/，界面如下方所示：

在该步骤下，需要手动点击网页的“Upload Audio File”按钮选择上传要配字幕的MP3音频文件。上传成功后，网站即开始自动识别过程。等到识别完成后，还需要手动点击下方的Word Timings and Alternatives，即可看到按顺序识别到的单词及对应的开始时刻。

注：（1）界面上方的保存按钮，可以将识别后的网页内容保存成本地htm文件，下一次可点击载入按钮直接载入，而无需重复识别过程。

（2）当点击界面下方的“下一步”按钮时，程序会自动扫描网页内容，生成由单词和时刻信息组成的单词时刻字典列表，这里记作lstDict，其类型为List<KeyValuePaire<

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。