![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
OCR
薛定谔的智能
这个作者很懒,什么都没留下…
展开
-
生成高斯热力图(craft中有使用)+2d heatmap+3d heatmap
from math import expimport numpy as npimport cv2import osclass GaussianTransformer(object): def __init__(self, imgSize=512, region_threshold=0.4, affinity_threshold=0.2): distanceRatio = 3.34 scaledGaussian = la.原创 2020-06-04 10:26:21 · 5183 阅读 · 4 评论 -
利用dbnet分割条形码与文字(代码+模型)+知识蒸馏+tensorrt推理+利用pyzbar和zxing进行条形码解析
1.安装环境:apt-get install zbar-toolsapt-get install python-jpypepip install pyzbarpip install zxing2.代码案例#coding:utf-8import pyzbar.pyzbar as pyzbarimport timeimport shutilimport zxingimport cv2def parse_code(codeimg, reader): """ .原创 2020-07-08 10:25:42 · 3322 阅读 · 8 评论 -
收缩分割多边形(PSENet中有使用)
目的:为了解决密集文本的分割问题代码:# -*- coding=utf-8 -*-import osimport cv2import Polygon as plgimport pyclipperimport numpy as npdef dist(a, b): return np.sqrt(np.sum((a - b) ** 2))#计算周长def perimeter(bbox): peri = 0.0 for i in range(bbox.shap原创 2020-06-05 14:45:33 · 869 阅读 · 4 评论 -
ctpn论文阅读与代码
代码地址:1.通用的目标检测是封闭的,而文字是封闭且连续2. 构造一系列宽度相等的小文本,回归中心y坐标和高度3. 对于边界回归x坐标,在进一次修正4.整个模型就是backbone提取特征,将每个像素点的相邻3*3像素拉成行向量,利用空间信息,在进入lstm提取时序信息进行分类与回归.5.文本构建算法将每个相邻竖直文本框进行合并6.一些中间过程...原创 2020-05-23 17:09:06 · 365 阅读 · 0 评论 -
pdf与图片互相转换
1.pdf转图片import osimport numpy as npimport cv2from PIL import ImageImage.MAX_IMAGE_PIXELS=Noneimport tempfileimport timeimport sysfrom pdf2image import convert_from_bytes# # 预处理程序# sys.pa...原创 2020-03-13 10:36:15 · 562 阅读 · 0 评论 -
利用xlwt写excel并进行单元格的合并
1.写入行列值import xlwt# 创建一个workbook 设置编码workbook = xlwt.Workbook(encoding='utf-8')# 创建一个worksheetworksheet = workbook.add_sheet('My Worksheet')# 写入excel# 参数对应 行, 列, 值worksheet.write(1, 0, labe...原创 2020-02-25 15:03:26 · 4139 阅读 · 0 评论 -
利用scipy包计算表格线的峰值,还原表格得到表格结构
import cv2import numpy as npfrom scipy.signal import find_peaks, peak_widthsdef get_lines_from_image(img_bin, axis, kernel_len_div = 20, kernel_len = None, iters = 3): """ :param img_bin...原创 2020-02-01 17:07:56 · 392 阅读 · 0 评论 -
计算polygon面积和判断顺逆时针方向的方法
一.利用shapely求polygon面积 import shapely from shapely.geometry import Polygon, MultiPoint # 多边形 # box1 = [2, 0, 4, 2, 2, 4, 0, 2, 0, 0] box1 = [2, 0, 4, 2, 2, 4, 0, 2, 2, 2] poly_box1...原创 2019-11-26 17:28:31 · 3370 阅读 · 0 评论 -
RNN知识+LSTM知识+encoder-decoder+ctc+基于pytorch的crnn网络结构
一.基础知识:序列特点就是某一步的输出不仅依赖于这一步的输入,还依赖于其他步的输入或输出.1.RNN:xt不止与该时刻输入有关还与上一时刻的输出状态有关,而第t层的误差函数跟输出Ot直接相关,而Ot依赖于前面每一层的xi和si,?≤?i≤t,故存在梯度消失或梯度爆炸的问题,对于长时序很难处理.所以可以进行改造让第t层的误差函数只跟该层{si,xi}有关.2.LSTM:传统R...原创 2019-09-14 11:58:34 · 5246 阅读 · 0 评论 -
利用已有的标注文字信息制作fake数据
from PIL import Image, ImageDraw, ImageFont, ImageFilterimport randomimport globimport numpy as npimport osimport cv2from nespaper_semantics import seg_str'''1. 从文字库随机选择10个字符2. 生成图片3. 随机使用...原创 2019-12-06 11:49:07 · 1875 阅读 · 0 评论 -
将MSRA-TD500标签转换成逆时针输出标签+labeleme json格式转四个点的txt
MSRA-TD500 :http://www.iapr-tc11.org/mediawiki/index.php/MSRA_Text_Detection_500_Database_%28MSRA-TD500%29#coding:utf-8"""fzh created on 2019/12/6将MSRA-TD500数据标签转换成按逆时针输出也即 index,difficulty ...原创 2019-12-06 15:56:50 · 582 阅读 · 0 评论