深度学习
文章平均质量分 60
cc_moe
这个作者很懒,什么都没留下…
展开
-
增值税发票识别(调研ing)
参考链接:https://zhuanlan.zhihu.com/p/145312833原创 2021-07-12 21:08:29 · 2669 阅读 · 0 评论 -
DBNet理论知识(草稿)
检测方法:基于回归的方法(文本框):基于分割(基于像素点的分类)的方法(DBNet):分割:原创 2021-07-01 21:15:12 · 1104 阅读 · 0 评论 -
ANSI 编码格式与 UTF-8 不兼容问题
ANSI 编码格式与 UTF-8 不兼容,格式转换后任会出现空格行检测和去除不掉问题。解决方案(定位,手动清除):with open(r"D:\pythonProject\xxxxx-pytorch-master\data\char_dict.txt", 'rb') as file: #读取文件,检测实际非空行数 #char_dict = {char.strip().decode('gbk','ignore'):num for num, char in enume原创 2021-01-06 14:21:49 · 1261 阅读 · 0 评论 -
OCR——阿里OCR方案
1. 文字定位定位⽂字在图像中的位置并表征成⾏(1)特征问题 :背景等特征⼲干扰问题 深度学习可以较好的解决特征问题(2)scale问题 : 物体定位的共性问题(3)成⾏行行问题 :⽂文字定位特有问题2. 文字识别3.通用结构化4.系统效率...原创 2020-12-21 14:18:30 · 891 阅读 · 1 评论 -
OCR——论文分享
2020-12-12/星期六《CharacterRegionAwarenessforTextDetection》发表于CVPR(2019)。论文利用分割的思想,对单字符实例和字符间的连接关系进行检测,通过连接字符实例实现不规则(变形、弯曲)文本检测。链接:https://ieeexplore.ieee.org/document/89538462020-12-16/星期三《DeepRelationalReasoningGraphNetworkforArbitrary...原创 2020-12-18 11:09:23 · 352 阅读 · 0 评论 -
OCR——视觉会议调研
视觉会议:icpr2020:Challenge: 1EndoTect: A Competition on Automatic Disease Detection in the Gastrointestinal TractChallenge: 2The 2nd Grand Challenge of 106-Point Facial Landmark LocalizationChallenge: 3AcTiVComp20Competition on Superimposed Text De..原创 2020-12-16 19:18:17 · 4000 阅读 · 0 评论 -
OCR——数据集调研
2020-12-14调研数据集:icdar—— ic2015,2017,2019 CTW—— 1500https://zhuanlan.zhihu.com/p/60459597原创 2020-12-14 11:03:07 · 4007 阅读 · 0 评论 -
OpenCV计算机视觉(5)——直方图和傅里叶变换
直方图cv2.calcHist(images,channels,mask,histSize,ranges)images:原图像格式为uint8或float32,当传入函数时应用括号 [] 同一样括住表示,例如[img] channels:同样用[]括,它会告诉函数,我们统幅图像的直方图。如果传入图像是灰度图,它的值就是 [0] 如果是彩色图像的传入参数可以是 [0] [1] [2] 它们分别对应着R G B mask:掩膜图像。统整幅图像的直方图就把它为None。但是如果你想统图像某..原创 2020-12-14 10:10:09 · 779 阅读 · 0 评论 -
OpenCV计算机视觉(4)——卷积原理与操作
卷积(每次卷积完之后+Relu(非线性))卷积核的深度和输入图像深度一致,有多少个卷积核,就得到多少张特征图,也就是得到的特征图的深度。1个卷积核的卷积过程:stride越小得到的特征越丰富/多,但是考虑效率的问题,stride一般不会设置为1,stride太大会损失很多信心。padding能更好得利用边缘信息,特征图大小计算:权重共享,一个特征图,参数数量=filter大小+b,多个特征图=n*(filter+b)大小池化Pooling layer(对特征图压缩)(下原创 2020-12-12 14:44:00 · 390 阅读 · 0 评论 -
OpenCV计算机视觉(3)——opencv--文档扫描OCR识别
检测流程:边缘检测 -> 获得轮廓 -> 透视变换(即放平,包括平移旋转反转等) -> OCR识别一、边缘检测if __name__ == "__main__": # 读取输入 image = cv2.imread(args["image"]) # resize 坐标也会相同变化 ratio = image.shape[0] / 500.0 orig = image.copy() image = resize(orig, height = 500) # 同比原创 2020-12-11 11:43:44 · 2347 阅读 · 3 评论 -
OpenCV计算机视觉(2)——信用卡数字识别
信用卡数字识别-流程预览一、基础配置# 导入工具包from imutils import contoursimport numpy as npimport argparseimport cv2import myutils# 设置参数ap = argparse.ArgumentParser()ap.add_argument("-i","--image",default='./images/credit_card_01.png',help="path to input image原创 2020-12-10 17:02:17 · 2327 阅读 · 1 评论 -
序列标注
自然语言处理中的序列标注问题在目前, 比较主流的技术是语言模型(如LSTM, BERT)+CRF(条件随机场)。想要了解CRF(条件随机场), 首先了解一下隐马尔可夫模型(Hidden Markov Model), 是一种概率图模型(CRF也是), 只要理解了HMM模型和维特比解码算法(viterbi algorothm), 理解条件随机场就成了分分钟的事.1.NER(命名实体识别)问题概述;命名实体识别(英语:Named Entity Recognition,简称NER), 是指识别文本中具有特定原创 2020-09-19 21:56:30 · 335 阅读 · 0 评论 -
中文自然语言处理的完整流程
第一步:获取语料语料,即语言材料。语料是语言学研究的内容。语料是构成语料库的基本单元。所以,人们简单地用文本作为替代,并把文本中的上下文关系作为现实世界中语言的上下文关系的替代品。我们把一个文本集合称为语料库(Corpus),当有几个这样的文本集合的时候,我们称之为语料库集合(Corpora)。(定义来源:百度百科)按语料来源,我们将语料分为以下两种:1.已有语料很多业务部门、公司等组织随着业务发展都会积累有大量的纸质或者电子文本资料。那么,对于这些资料,在允许的条件下我们稍加整合,把纸质的文本转载 2020-09-19 20:10:43 · 3967 阅读 · 0 评论 -
深度学习导论 - 读李宏毅《1天搞懂深度学习》
<article> <div id="article_content" class="article_content clearfix csdn-tracking-statistics" data-pid="blog" data-mod="popu_307" data-dsm="post"> <l转载 2018-05-25 10:11:24 · 484 阅读 · 0 评论