如何破解验证码

原创

于 2014-09-23 22:20:38 发布 · 1.1k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#python #验证码 #绕过验证码 #爬虫 #cnbeta

本文探讨了如何尝试绕过网站的验证码系统，主要针对cneta的评论验证码。作者通过分析请求，发现验证码与时间有关，提出可能通过替换时间参数来获取固定验证码的思路。然而，验证码的验证机制不明确，限制了这种方法的成功率。作者提到，如果验证码与时间绑定，可能存在一次性识别一个验证码就能评论多篇文章的可能性，通过多进程和代理IP可能实现自动化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

这是我今天写的第四篇文章，今天一天对未来隐隐的有些担忧，或许该是时候去找份工作了。

豆瓣登录的时候会有验证码，cneta评论的时候会有验证码，验证码一般需要ocr去采出来。但是，能不能绕过去呢？

这个方法我并没有成功，因为我最近在上算法课，大部分心思都在别处，今天写下来，也是为了以后做个备忘。

首先就是评论cneta，抓取内容，看看都需要发送什么

其实还是一样，content是内容，secode是验证码，yll_CSRE_TOKEN在cookies中可以找到，sid是文章的编码，文章的最后的目录。

只要get一下，然后从cookies中拿到token，发回去就可以。关键就是怎么破解验证码了。

上图就是验证码生成的过程产生的数据，把第一网址拷贝到浏览器上，就可以得到验证码图片，拿去ocr破解即可。

但是最后那串数字好熟悉，拿去测试了一下，果然是时间，也就是说，验证码的产生依赖于时间，我可以把最后的时间替换成现在的时间，就可以得到一个验证码。

我现在不太理解的是，验证码如何验证，因此只能打消，看样子最好自己做个网站试试看才知道。如果说验证码是跟时间绑定的，搞不好每个时间产生的验证码是固定的，我们就可以在cookies中欺骗服务器我们得到的是同一个验证码，这样我可以人工识别一个验证码，然后一次性评论多篇文章，毕竟cnbeta的评论地址都一样，只是靠sid去辨别评论的文章。同时开几个进程，每个进程弄个proxy，不就一切大吉了？

对我而言，最大的问题就是，谁要评论cnbeta呢？

<

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。