自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

转载 python 验证码识别示例(二) 复杂验证码识别

  在这篇博文中手把手教你如何去分割验证,然后进行识别。一:下载验证码      验证码分析,图片上有折线,验证码有数字,有英文字母大小写,分类的时候需要更多的样本,验证码的字母是彩色的,图片上有雪花等噪点,因此识别改验证码难度较大二:二值化和降噪:    三: 切割:    四:分类:    五: 测试识...

2018-08-10 17:55:00 782

转载 快速排序算法的两种实现思路(附源代码)

转载于:https://www.cnblogs.com/xuchunlin/p/9428830.html

2018-08-06 10:19:00 125

转载 python 验证码识别示例(一) 某个网站验证码识别

某个招聘网站的验证码识别,过程如下一: 原始验证码:二: 首先对验证码进行分析,该验证码的数字颜色有变化,这个就是识别这个验证码遇到的比较难的问题,解决方法是使用PIL 中的getpixel 方法进行变色处理,统一把非黑色的像素点变成黑色                                变色后的图片三: 通过观察,发现该验证码有折...

2018-08-03 18:07:00 256

转载 爬虫 大规模数据 采集心得和示例

本篇主要介绍网站数据非常大的采集心得1. 什么样的数据才能称为数据量大:  我觉得这个可能会因为每个人的理解不太一样,给出的定义 也不相同。我认为定义一个采集网站的数据大小,不仅仅要看这个网站包括的数据量的大小,还应该包括这个网址的采集难度,采集网站的服务器承受能力,采集人员所调配的网络带宽和计算机硬件资源等。这里我姑且把一个网站超过一千万个URL链接的叫做数据量大的网站。...

2018-08-01 11:52:00 515

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除