注意,本文只提供学习的思路,严禁违反法律以及破坏信息系统等行为,本文只提供思路
本文的验证码网址如下,使用base64解码获得
aHR0cHM6Ly93d3cudXJidGl4LmhrL21lbWJlci1sb2dpbg==
通常验证码类型都是图片组成,语音验证码的场景其实用的非常少,因为语音需要接入耳麦去听,这样整个步骤会更复杂,而且如果是在某些公共场所不能大声外放,所以语音验证码其实并不多见,如下图所示,其实本身就有图形验证码的登录场景,为什么还要做语音验证码,作者做这一块的目的一方面是有朋友驱使,另一方面我也想做更多难的事,突破自身技术,同样在过程中学习。
本文由于不支持插入mp3格式音乐播放,所以在阅读本文过程中,其实是不知道目前需要解决的是一种什么难度的验证码,这个可以到具体网址去播放听听看,目标验证码大概是一段10s左右的语音,由一个男声播放,5-7个字符的验证码,播放两遍,并且噪音很强,那么识别这种验证码的步骤其实跟图形验证码差不多,都是标注、训练、导出预测,同样的过程,只是用到的工具不同,这里我使用了百度飞桨的paddlespeech,一开始,我使用开源的预训练的模型去识别,发现效果并不好,那么只能自己训练了,训练步骤如下。