反爬虫的一些心得

  1. 转载请注明来源
  2. 本帖持续更新

1. 为什么会弹出验证码

访问频率太高,网站会针对性的弹出验证码限制你的访问,一般有这几种情况:

  1. 记录了你的IP访问频率,针对IP弹出验证码
  2. 记录了你的cookies访问频率,针对此账号弹出验证码
  3. 双管齐下,同时限制你的IP和账号的访问

2. 比较好的验证码设计

2.1 第一种

在这里插入图片描述
这种好像是谷歌的验证码生成库生成的中文验证码。
抛开大量样本的深度学习不说,这种验证码的难点在于:

  1. 干扰线粗,几乎和字符差不多,占面积大,难以使用一般的降噪算法解决;
  2. 干扰线和字体颜色多变,有时候为同一种颜色,无法使用颜色分离算法;
  3. 背景色跨度大,加上干扰线和字符颜色也多变,难以准确的消除背景。

特征:观察了若干样本,发现干扰线的颜色一致,长度也固定在某个范围,且基本上都会比汉字字符的笔画长。

3. 参数加密是怎么回事

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值