在“验证码破解实战一例”中提到曾捣鼓过百度贴吧的验证码,不过分割始终做不好,最近整理了下,记在这里吧。
效果演示程序下载:TiebaCode.rar
效果截图:
由于分割工作做的不好,演示程序识别过程中有时会多次刷新验证码以达到较好的分割效果。
另外,之前捣鼓这的时候也顺便折腾了下使用python模拟百度贴吧发帖,不过一直没能成功,在此给出模拟发帖的源代码,还望高手看到后能指点指点。
之所以没能模拟成功,自己琢磨着还是验证码获取那部分有问题,程序最后会返回贴吧验证发帖的js代码,如下
成功发帖的resultNo为0,而我的程序的返回结果一直是308,308在上述的js代码中没有给出出错定义,不过我记得之前弄这个的时候一直返回的是38,38给出的出错原因是验证码超时,我怀疑这个308其实就是38所代表的含义。我曾经对一款百度发贴机发帖过程抓包,其处理验证码的部分跟我上面的程序基本没区别,现在真不知道问题出在哪。