自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 tesseract train python_file

# tesseract-trainerThis is a set of two tools used to generate OCR training files for Tesseract. It is particularly designed for image files with small numbers of characters. It will help you create

2017-08-29 13:47:58 484

原创 训练tesseract

tesseract识别率,通过样本数量提升,呈对数型增长,所以根据你的验证码的复杂程度来确定你的训练样本数量因为本身tesseract的识别精度很低,所以很有必要进行训练验证码:是由背景图片和字符图片复合而成,训练的时候我们要告诉每个验证码样本里,字符的位置(上下左右四个参数)和字符的值定位元素的位置:  下载工具jTessBoxEditor. http://sourc

2017-08-28 18:05:08 1110

原创 tesseract_OCR验证码识别技术(python)

一、安装pytesseract:pip install pytesseract二、安装PIL:pip install PIL三、安装tesseract-OCR:      下载tesseract-ocr文件并安装,注意有一部要选择自己需要的语言包:https://github.com/UB-Mannheim/tesseract/wiki 默认只支持英文验证码

2017-08-24 08:50:14 3889

原创 checkstyle检测后的修改方法

1.工具类不应该有公有的构造函数工具类是一系列静态成员或方法的集合,意味着它不可以被实例化,即使是抽象的工具类,它可以被继承,但也不可以有公有的构造函数。Java类如果没有声明构造函数,则会默认有一个公有的构造函数,因此需要给工具类至少声明一个非公有的构造函数。不符合要求的代码示例class StringUtils { // Noncompliant public stati

2017-08-22 14:43:33 3924

原创 python用到的库

常用Python第三方库  分类库名称库用途Web框架Django开源web开发框架,它鼓励快速开发,并遵循MVC设计,我以前用过很多次,比较好用,开发周期短 ActiveGrid企业级的Web2.0

2017-08-21 19:16:20 539

原创 String、Cstring、char*

char*最基本的类Cstring在MFC中会使用到String在C++中会使用到通过char类型转换成相应的对象string 到Cstring:cstring.format("%s",string.c_str());cstring到string:string s(cstring.getbuffer());string到char*:string.c_st

2017-08-21 17:27:34 269

原创 生成代码文档图—doxygen graphviz

用于代码写完之后补充详细设计说明书doxygen 生成文档结构图的开源软件,下载之后,按照说明选择设置,在expert中dot模块,把graphviz的bin目录写进去,运行之后,doxygen会自己编辑dot脚本graphviz  通过dot脚本,转换成图像

2017-08-21 17:14:48 518

原创 Junit覆盖率插件—Eclemma

Eclemma安装方法一:在EclipseMaeketplace中搜索emma会搜索出本软件,然后点击安装安装成功后,会提示重启eclipse,重启之后就安装成功了安装方法二:Install new softwares中:-------------------------------------------------------------------------

2017-08-18 17:43:56 1058

原创 python文件操作

CSV文件import csv,codecsbid_info=csv.DictReader(open('test.csv','r'))dict_data=[]for lines inbid_info:    if bid_info.line_num ==1:#跳过第一行        continue    else:        dict_data.append...

2017-08-18 16:03:39 443

原创 notepad++使用技巧

1。不排序去除重复行勾选 正则表达式  和  匹配新行(re.D) ,在替换框中使用^(.*?)$\s+?^(?=.*^\1$)替换为空白注意:此种方法可能和正则表达式本身有关系,每次处理500行为佳.*?  非贪婪模式匹配任意字符+ 至少一次,\s+把所要匹配的字符串限制为一行或者其他带有空格的行^(.*?)$\s+?  非贪婪匹配任意行,行后可跟多个空白符

2017-08-18 14:03:06 4977

原创 正则表达式(python为纲)

正则表达式re.match函数:re.match(pattern, string, flags=0)参数描述pattern匹配的正则表达式string要匹配的字符串。flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。s

2017-08-18 12:37:05 436 1

转载 python筛选中日韩文

通常我们可以使用 repr()函数查看字串的原始格式。这对于写正则表达式有所帮助。UTF-8 是变长的,1-6个字节,少数是汉字每个占用3个字节,多数占用4个字节,正则式为[\x80-\xff]{3}re.match(), re.search 。两个函数的匹配过程完全一致,只是起点不同。match只从字串的开始位置进行匹配,如果失败,它就此放弃;而search则

2017-08-01 10:21:34 6159

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除