- 博客(12)
- 收藏
- 关注
原创 tesseract train python_file
# tesseract-trainerThis is a set of two tools used to generate OCR training files for Tesseract. It is particularly designed for image files with small numbers of characters. It will help you create
2017-08-29 13:47:58 499
原创 训练tesseract
tesseract识别率,通过样本数量提升,呈对数型增长,所以根据你的验证码的复杂程度来确定你的训练样本数量因为本身tesseract的识别精度很低,所以很有必要进行训练验证码:是由背景图片和字符图片复合而成,训练的时候我们要告诉每个验证码样本里,字符的位置(上下左右四个参数)和字符的值定位元素的位置: 下载工具jTessBoxEditor. http://sourc
2017-08-28 18:05:08 1155
原创 tesseract_OCR验证码识别技术(python)
一、安装pytesseract:pip install pytesseract二、安装PIL:pip install PIL三、安装tesseract-OCR: 下载tesseract-ocr文件并安装,注意有一部要选择自己需要的语言包:https://github.com/UB-Mannheim/tesseract/wiki 默认只支持英文验证码
2017-08-24 08:50:14 3908
原创 checkstyle检测后的修改方法
1.工具类不应该有公有的构造函数工具类是一系列静态成员或方法的集合,意味着它不可以被实例化,即使是抽象的工具类,它可以被继承,但也不可以有公有的构造函数。Java类如果没有声明构造函数,则会默认有一个公有的构造函数,因此需要给工具类至少声明一个非公有的构造函数。不符合要求的代码示例class StringUtils { // Noncompliant public stati
2017-08-22 14:43:33 4044
原创 python用到的库
常用Python第三方库 分类库名称库用途Web框架Django开源web开发框架,它鼓励快速开发,并遵循MVC设计,我以前用过很多次,比较好用,开发周期短 ActiveGrid企业级的Web2.0
2017-08-21 19:16:20 549
原创 String、Cstring、char*
char*最基本的类Cstring在MFC中会使用到String在C++中会使用到通过char类型转换成相应的对象string 到Cstring:cstring.format("%s",string.c_str());cstring到string:string s(cstring.getbuffer());string到char*:string.c_st
2017-08-21 17:27:34 282
原创 生成代码文档图—doxygen graphviz
用于代码写完之后补充详细设计说明书doxygen 生成文档结构图的开源软件,下载之后,按照说明选择设置,在expert中dot模块,把graphviz的bin目录写进去,运行之后,doxygen会自己编辑dot脚本graphviz 通过dot脚本,转换成图像
2017-08-21 17:14:48 535
原创 Junit覆盖率插件—Eclemma
Eclemma安装方法一:在EclipseMaeketplace中搜索emma会搜索出本软件,然后点击安装安装成功后,会提示重启eclipse,重启之后就安装成功了安装方法二:Install new softwares中:-------------------------------------------------------------------------
2017-08-18 17:43:56 1091
原创 python文件操作
CSV文件import csv,codecsbid_info=csv.DictReader(open('test.csv','r'))dict_data=[]for lines inbid_info: if bid_info.line_num ==1:#跳过第一行 continue else: dict_data.append...
2017-08-18 16:03:39 467
原创 notepad++使用技巧
1。不排序去除重复行勾选 正则表达式 和 匹配新行(re.D) ,在替换框中使用^(.*?)$\s+?^(?=.*^\1$)替换为空白注意:此种方法可能和正则表达式本身有关系,每次处理500行为佳.*? 非贪婪模式匹配任意字符+ 至少一次,\s+把所要匹配的字符串限制为一行或者其他带有空格的行^(.*?)$\s+? 非贪婪匹配任意行,行后可跟多个空白符
2017-08-18 14:03:06 5175
原创 正则表达式(python为纲)
正则表达式re.match函数:re.match(pattern, string, flags=0)参数描述pattern匹配的正则表达式string要匹配的字符串。flags标志位,用于控制正则表达式的匹配方式,如:是否区分大小写,多行匹配等等。s
2017-08-18 12:37:05 462 1
转载 python筛选中日韩文
通常我们可以使用 repr()函数查看字串的原始格式。这对于写正则表达式有所帮助。UTF-8 是变长的,1-6个字节,少数是汉字每个占用3个字节,多数占用4个字节,正则式为[\x80-\xff]{3}re.match(), re.search 。两个函数的匹配过程完全一致,只是起点不同。match只从字串的开始位置进行匹配,如果失败,它就此放弃;而search则
2017-08-01 10:21:34 6374
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人