百度贴吧验证码识别研究小记

 

在“验证码破解实战一例”中提到曾捣鼓过百度贴吧的验证码,不过分割始终做不好,最近整理了下,记在这里吧。

 

 

效果演示程序下载:TiebaCode.rar

 

 

效果截图:

 

pic

 

pic

 

pic

 

 

由于分割工作做的不好,演示程序识别过程中有时会多次刷新验证码以达到较好的分割效果。

 

 

另外,之前捣鼓这的时候也顺便折腾了下使用python模拟百度贴吧发帖,不过一直没能成功,在此给出模拟发帖的源代码,还望高手看到后能指点指点。

 

 

 

 

之所以没能模拟成功,自己琢磨着还是验证码获取那部分有问题,程序最后会返回贴吧验证发帖的js代码,如下

 

 

 

成功发帖的resultNo为0,而我的程序的返回结果一直是308,308在上述的js代码中没有给出出错定义,不过我记得之前弄这个的时候一直返回的是38,38给出的出错原因是验证码超时,我怀疑这个308其实就是38所代表的含义。我曾经对一款百度发贴机发帖过程抓包,其处理验证码的部分跟我上面的程序基本没区别,现在真不知道问题出在哪。

 

 

 

评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值