音频识别,获取文字
本菜鸟这学期有个自主学习英语课,课上有个听力部分。考试主要是其中的Task 3 部分。老师让我们重点听那部分。可是给的音频是以Unit 为单元的。Unit分为3个Part, 每个Part 又分为 3个Task。非常坑爹。自己找Task 3部分的位置很麻烦,所以想用语音识别定位”Task three”的位置。可惜本菜鸟不懂语音识别,就找了个网上现成的工具:popuparchive (可能需要fangqiang)。把音频传上去,它会在后台处理音频。生成对应的“歌词”。之后我们就可以定位了。不过有几个问题:
1. 对免费用户一个月的处理量有限制。
2. 处理的结果不是很完美,主要是断句不是很对。
步骤如下:
首先注册,这步不用多说。
登录进去后,点击my collections:(如下图)
给my collections 上传音频。
点击”Upload one file at a time” 选择本地的音频文件。
上传完成后点击一个文件,进入查看:
显示目前正在处理,处理完毕后会邮件通知:
处理完毕后再进入查看,结果如下:
不过可惜的是,处理的结果不是很完美。比如会把“Task three”处理成“Task. Three”。 可以通过查找”Task. Three”或者这句话的上下文来定位。