- 博客(7)
- 资源 (1)
- 收藏
- 关注
原创 debian9 安装 pytesseractocr python中识别
1. 安装 tesseract-ocr 包apt-get install tesseract-ocr直接不能运行就用更高的权限2. 安装 PIL如果没有PIL也要下载apt-get install python-imaging3. 安装 pytesseractpip install pytesseract然后就能用了import pytesseractfrom PIL impo...
2019-08-30 09:22:18 348
原创 cv2.findContours 和 measure.find_contours 找轮廓
分别属于cv2 和 skimage连个库先来看函数的源代码的解释:def find_contours(array, level, fully_connected='low', positive_orientation='low'): """Find iso-valued contours in a 2D array for a given level...
2019-08-26 22:29:13 4975
ocr 身份证
最近呢,有一个比赛,,传送门,要求提取身份证中的信息。大致是这样的:这个清晰度有高有低,有点挑战的是还有章,这种水印。这就有点难受了,不过这才有意思,没意思来弄啥比赛。大致思想:先将这个两块有用的弄下来(想着涉及聚类),然后,找住方向,给他放正了(用svm,运算量感觉很小),接着从上面把有字的那一小块弄出来,然后再识别。还没动手,感觉很溜。...
2019-08-24 18:42:30 129
原创 PdfFileWriter().write() UnicodeEncodeError: 'latin-1' codec can't encode characters in position 8-9
这个小python是用来将pdf转化成图片的,看样子有两中方法一是:Wand,二是:pdf2image我用的pdf2image,因为这个pdf大小不定,少的几十页,多的可能有几千页,在用pdf2image时大致有两种from pdf2image import convert_from_pathconvert_from_path('a.pdf', 500, "output",fmt="JP...
2019-08-24 10:49:49 2799 7
原创 pdf转图片 缩印的那种 特征明显的
要得呢就是左边的这种。缩小版的 原意呢是从pdf里面找表格,流程图,原来的代码是pdf转图片(默认是1654x2339 pixels,这块原来也不知道能调整),然后从图片上用滑窗,svm,图像金字塔,NMS等技术把流程图,表格那块截下来,,呃呃呃,扯远了。。。。。。好像和标题没有关系。。。。。。images = convert_from_path(temp, dpi=9...
2019-08-23 20:13:06 356
原创 小记 linux 解压 zip rar tar.gz 复制 移动 删除
用,查。一直用,一直查。快烦死了,老是查所以整理一下,常用的。。电子版:.tar tar -zcvf name.tar tar zcvf name.tar.gz file1 file2 .zip zip name.zip name 把name压缩到当前目录为name.zip unzip name.zip 解压到当前目录 unzip name...
2019-08-22 10:45:44 388
原创 debain快捷键设置 截屏 音量等其他
我的是debian9.8+xfacedebian系统这个比ubuntu是简洁的多,更底层,更难搞点。但是确实稳定,i like it。太简洁了,就导致有些功能没有了。来看看咋弄:我是笔记本,f10键上有个小喇叭和上,原来用ubuntu就是直接按fn键和这个f10就能让声音减小,但是debian不行。。。。。而且好像一开始连声音都不能变化,找不到地方!!!!!!!!!后来呢吧,好象是下了一个能...
2019-08-20 19:07:18 435
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人