- 博客(66)
- 收藏
- 关注
原创 常用的表格检测识别方法——表格结构识别方法 (下)
论文提出了一种新的表格结构识别方法,它包含两个有效的组件:一个基于SepRETR的分割线预测分割模块和一个基于关系网络的用于跨行单元格恢复的单元格合并模块。与以往基于图像分割的分割线检测方法相比,基于SepRETR的分割线回归方法可以在不依赖启发式mask-to-line模块的情况下实现更高的TSR精度。实验结果表明,所提出的先验增强的二分匹配策略可以有效地提高两阶段DETR的收敛速度。因此,论文的方法在三个公共基准SciTSR、PubTabNet和WTW测试上取得了最先进的性能。在更具挑战性的真实内部数据
2023-06-01 14:59:50
457
原创 常用的表格检测识别方法——表格结构识别方法(上)
表格结构识别是表格区域检测之后的任务,其目标是识别出表格的布局结构、层次结构等,将表格视觉信息转换成可重建表格的结构描述信息。这些表格结构描述信息包括:单元格的具体位置、单元格之间的关系、单元格的行列位置等。在当前的研究中,表格结构信息主要包括以下两类描述形式:1)单元格的列表(包含每个单元格的位置、单元格 的行列信息、单元格的内容);2)HTML代码或Latex代码(包含单元格的位置信息,有些也会包含单元格的内容)。
2023-05-24 10:16:25
391
原创 常用的表格检测识别方法 - 表格区域检测方法(下)
本文介绍了一种利用可变形transformer对文档图像进行表格检测的半监督方法。该方法通过将伪标签生成框架集成到一个简化的机制中,减轻了对大规模注释数据的需要,并简化了该过程........
2023-05-19 11:03:07
344
原创 常用的表格检测识别方法-表格区域检测方法(上)
表格检测识别一般分为三个子任务:表格区域检测、表格结构识别和表格内容识别。本章将围绕这三个表格识别子任务,从传统方法、深度学习方法等方面,综述该领域国内国外的发展历史和最新进展,并提供几个先进的模型方法。
2023-05-18 12:13:33
607
原创 合合信息亮相CCIG2023:多位大咖共话智能文档未来,文档图像内容安全还面临哪些技术难题?
近日,中国图象图形大会(CCIG 2023)(简称“大会”)在苏州圆满落幕。本届大会以“图象图形·向未来”为主题,由中国科学技术协会指导,中国图象图形学学会主办,苏州科技大学承办,特邀谭铁牛院士、赵沁平院士、吴一戎院士等百余位国内外知名学者,来自代表企业的技术专家,共话图像图形学术研究与技术创新趋势,共谋行业新发展。
2023-05-17 15:12:17
246
原创 【倒计时2天】CCIG文档图像智能分析与处理论坛开启直播预约,共探智能文档处理前沿技术
为了促进文档图像分析与处理领域的技术交流及发展,中国图象图形学学会文档图像分析与识别专业委员会与合合信息共同打造了《文档图像智能分析与处理》高峰论坛。本次论坛中,合合信息特别邀请了来自中科院自动化所、北大、中科大、华南理工大的学术专家与华为等知名企业的研究者们,围绕文档图像处理及OCR领域的前沿技术展开“头脑风暴”,寻找文档图像处理领域的未来进阶方向。
2023-05-11 21:19:39
397
原创 精准锁定证件材料篡改位置,合合信息智能图像处理技术助力金融机构防范违规开户
近期,合合信息推出智能开户解决方案,在智能图像处理技术的支持下,帮助银行、证券业等金融机构解决人工审核时间成本高、材料伪造识别难、采集图像质量差等痛点,提升业务自动化处理效率,降低电信网络诈骗风险。现阶段,图像内容安全已成为AI安全的重点领域,图像篡改检测技术是图像内容安全的“防火墙”,在未来还有广阔的发展和应用空间。据悉,合合信息研发了基于深度学习的图像篡改检测技术及相关系统,通过学习图像被篡改后统计特征的变化,智能捕捉图像在篡改过程中留下的细微痕迹,可检测出复制粘贴、拼接、擦除等多种篡改形式。
2023-05-11 11:25:03
247
原创 Marior去除边距和迭代内容矫正用于自然文档矫正
作者提出了一种简单而有效的方法,Marior,以从粗到细的方式为变形文档图像矫正。作者采用两个级联模块,首先去除文档图像的边缘,然后对内容进行进一步的修正。所提出的Marior自适应地决定了迭代的次数,从而实现了效率和性能之间的权衡。作者提出的方法不仅在DocUNet [25]和OCR_REAL [23]基准数据集上取得了最先进的性能,而且成功地解决了具有大边缘区域的情况和没有边缘区域的情况,这在以往的研究中研究较少。这是在自然文档矫正方面的一个重大成功。在今后的工作中,有必要探索对这两个模块进行端到端优化
2023-04-28 10:52:32
620
原创 合合信息新推出反光消除技术,助力手写文字识别更精准
合合信息反光消除技术能够根据手写板笔迹的风格进行特征提取,并对手写文字进行特征编码,助力文档图像中反光区域文字的提取。相关技术人员表示,除了文档图像处理外,反光消除技术在专业摄影、视频处理等领域也具备广阔的应用空间,有望为科研记录、观察提供强大的支撑。
2023-04-26 11:09:28
440
原创 SLBR通过自校准的定位和背景细化来去除可见的水印
本文研究了水印去除任务,开发了一种具有新的MBE、SMR和CFF模块的两阶段多任务网络,该网络可以对水印进行定位,同时恢复无水印图像。在两个数据集上的大量实验验证了作者所提出的网络的优越性。
2023-04-14 11:36:26
182
原创 如何提升智能文档处理识别精度?合合信息“版面分析”实现新突破
近期,人工智能及大数据科技企业合合信息持续突破版面分析技术在版面分割、区域间的逻辑关系处理等方面的难题,通过智能文字识别、智能图像处理等核心技,助力使用者从各类复杂的图片文档中精准获取信息。
2023-04-14 10:40:02
372
原创 【论文解读】不和谐区域定位
不和谐区域定位的目的是在与周围背景不兼容的合成图像中定位该区域。不和谐问题主要是由于图像编辑技术产生的颜色和照明不一致。在本研究中,作者倾向于将输入的图像转换到另一个颜色空间,以放大不和谐区域与背景之间的域差异,从而使模型更容易地识别不和谐区域。为此,作者提出了一种由一个颜色映射模块和一个不和谐的区域定位网络组成的新框架,其中前者配备了一种新的域差异放大损失,后者可以是一个任意的定位网络。在图像协调数据集上的大量实验表明了作者设计的框架的优越性。
2023-04-07 17:35:07
63
原创 【 论文解读】一个有效的图表图像数据提取框架
在本工作中,作者讨论了一个数据挖掘系统中的数据提取阶段。为了建立一个可靠的Box detector,作者比较了不同的目标检测方法,并找到了一个合适的方法来解决表征图表数据的特殊问题。具有多元回归头和FPN结构的模型取得了令人印象深刻的性能。为了建立鲁棒的point detector,与基于图像处理的方法和基于检测的方法相比,该基于分割的方法可以避免困难的启发式假设,并很好地区分近点。对于数据转换,作者提出了一种测量特征相似性的网络,它比基于图像的特征更稳健。在实验中,作者在数据提取的每个阶段都进行了实验。作
2023-03-30 15:07:55
178
原创 CSIG企业行-走进合合信息成功举行,聚焦生成式人工智能、智能文档处理前沿热点
3月18日,由中国图象图形学学会(CSIG)主办,合合信息、CSIG文档图像分析与识别专业委员会联合承办的“CSIG企业行”系列活动成功举办。此次活动以“图文智能处理与多场景应用技术展望”为主题,特邀来自上海交大、厦门大学、复旦大学、中科大的知名学府的学者与合合信息技术团队一道,面向行内研究者分享图像文档处理中的结构建模、底层视觉技术、跨媒体数据协同应用、生成式人工智能及对话式大型语言模型等研究及实践成果。
2023-03-22 15:25:21
403
1
原创 【 论文解读TCPN】一个基于序列的弱监督视觉信息抽取学习框架
论文提出了一个统一的弱监督学习框架TCPN用于视觉信息提取,它引入了一种有效的编码器、一种新的训练策略和一种可切换的解码器。该方法在EPHOIE数据集上显示出了显著的提高和在SROIE数据集上的竞争性能,充分验证了其有效性。视觉信息提取任务处于自然语言处理和计算机视觉的跨领域,作者的方法旨在缓解对完整注释的过度依赖和OCR错误造成的负面影响。
2023-03-21 09:51:50
127
转载 【倒计时3天】“CSIG企业行”走进合合信息,大咖解密智能文档处理背后的底层技术及AI未来展望
以“图文智能处理与多场景应用技术展望”为主题,聚焦图像文档处理中的结构建模、底层视觉技术、跨媒体数据协同应用、生成式人工智能及对话式大型语言模型等热门话题,特邀来自上海交大、厦门大学、复旦、中科大的知名高校的学者与合合信息技术团队一道,以直播的形式分享文档处理实践经验及NLP发展趋势,探讨ChatGPT与文档处理未来。
2023-03-15 11:34:41
110
原创 表格检测识别技术的发展历程
表格检测识别技术是一种利用计算机自动处理表格的技术,它可以实现从文本中检测出表格,并进行识别和提取。这种技术有助于提高文本处理的效率,为计算机辅助知识发现和知识挖掘提供了支持。
2023-03-10 20:00:19
779
原创 基于深度学习的【表格检测与识别技术】的优势
随着技术的不断成熟,许多研究开发了和实现了各种深度学习模型,提高了表格检测与识别技术的准确性和有效性。在普适表格识别和检测中,深度学习算法是有利的,但它仍有挑战需要解决......
2023-02-21 10:14:35
504
原创 不固定版式文档的OCR模型自主开发流程及技术应用实例
目前,一种更具效率、可用性、灵活性的OCR模型开发方式,正在被越来越多的企业所采用:依托外部厂商开发的文字识别训练平台,自主开发OCR模型。由于这些文字识别训练平台内置成熟的算法模型,企业不需要组建专业的算法团队,即可自行完成模型的创建、训练、部署全流程开发工作流。合合信息基于在智能文字识别领域深耕16年的深度学习算法能力与实训经验,推出了文字识别训练平台,为有OCR自主定制开发需求的企业提供低代码、自动化的一站式OCR开发平台。
2023-02-02 17:34:52
388
原创 别忘记我:通过局部-全局内容建模进行文本擦除方法
该论文针对文本擦除中存在的复杂背景修复的问题,提出了CTRNet,它利用局部和全局的语义建模提升模型的背景还原能力,它设计了Low-level Contextual Guidance(LCG)和High-level Contextual Guidance(HCG)去挖掘不同的语义表征,然后通过Local-Global Content Modeling(LGCM)进行局部与全局的特征建模,从而提升文本擦除的能力。
2023-01-18 11:46:52
566
1
原创 智能图像处理:基于边缘去除和迭代式内容矫正的复杂文档图像校正
本文简要介绍ACM MM 2022录用论文“Marior: Margin Removal and Iterative Content Rectification for Document Dewarping in the Wild”的主要工作。该论文针对现有的矫正方法只能在紧密裁剪的文档图像上获得较为理想的矫正效果这一不足,提出了一个新的矫正方法Marior。Marior采用渐进式的矫正方式来逐步提高矫正性能。具体而言:先利用分割结果进行环境边缘去除获得初步矫正结果,再通过预测偏移场迭代式地优化该初步结果。
2023-01-12 15:33:31
498
原创 领域首创!合合信息与上海大学联合开启贵州原生态古彝文典籍数字化项目
由于古彝文尚未取得预留的Unicode编码区段,数字化工程还处于起步阶段,所以在印刷出版时,需由一位彝文缮写员先将彝文字和国际编码抄写在书页的左侧,再将已输入电脑的汉文译文打印、剪切后粘贴在相应彝文字的右侧,形成目前常见的“四行体”彝汉文对译,过程。邵文苑提到,古彝文文献和口传史诗中记录了很多南诏古国、夜郎古国、巴蜀古国的奇闻异事,在理解典籍的基础上,可以通过电影、音乐剧、浸入式戏剧等形式进行创作,或打造“元宇宙”世界、IP主题乐园,让更多人跨越语种的隔阂,感受更多元的。15%的变体字,原稿中只会更多;
2022-12-23 17:16:42
1028
原创 文字检测识别技术的未来发展趋势和面临的选择
一个可行的解决方案可能是探索能够捕获不同语言的文本实例的常见模式的组合表示,并使用文本合成引擎生成的不同语言的文本示例来训练检测和识别模型。
2022-12-16 07:30:00
629
原创 商务部研究院信用所、启信宝联合发布《中国商务信用发展指数报告(2022)》
基于区域发展呈梯度分布现状,《报告》提出,要在数字技术创新应用浪潮中捕捉机会,推进信用信息深度开发利用,例如积极使用全国商务分领域信用信息相关平台或与平台对接,推动国家、省、市、区/县、镇/乡、街道/村庄六级网络条块联动;《报告》对中国商务信用的发展提出了相关对策建议。针对各省市间商务信用发展水平区域差异较大的问题,应加快创新发展步伐,积极促进各区域招商引资、信用经济,增进中国商务信用向市场主体活力、投融资用信更深层次发展,质量效益更上一层,并注重加快整合促进中小微市场主体高质量发展,尤其关注其生存环境。
2022-12-01 14:12:55
295
原创 2022全球数商大会顺利举行,合合信息旗下启信宝斩获年度数据产品奖
合合信息副总经理、董事陈青山受邀出席论坛,就工业数据如何通过场景知识融合,赋能生产制造、供应链等环节“增质提效”进行分享。大会还举办了“2022首届数据交易节”颁奖典礼,合合信息旗下启信宝数据产品“企势数达”斩获年度数据产品奖。
2022-11-28 11:27:49
1461
原创 3分钟登记流程3秒搞定,合合信息与腾讯云联合推出合规降本新方案
通过COS对象存储的生命周期管理能力,帮助大数据冷热分层,降低存储成本,达到“降本增效”的目的。该方案整合了合合信息在文字识别、文档管理等场景的技术和经验,以及腾讯云在云服务和海外市场服务的积累与优势,能够高效精准解决文档中各类语言、各类版式带来的审核效率问题,推动行业实现国际业务数字化、自动化的合规经营。
2022-11-21 10:30:03
681
原创 可防离职员工冒用身份,合合信息名片全能王与钉钉用数字名片打造安全“围栏”
合合信息旗下名片全能王是一款智能名片及人脉管理APP,基于合合信息的智能文字识别技术,可将复杂场景下的纸质名片转变为结构化的数字名片,也可在线创建、分发个人版及企业版数字名片,为用户提供人脉智能管理等服务。有不少用户反馈,自己工作的时候用钉钉,日常交流则使用其他软件,因为不同的平台上接收的名片无法统一整合,每次只能一条条存到通讯录里,而名片全能王与钉钉的合作节省了不少平台跳转、信息录入的时间。
2022-11-15 10:38:21
760
原创 CRAFTS:端对端的场景文本检测器
场景文本检测器由文本检测和识别模块组成。许多研究已经将这些模块统一为一个端到端可训练的模型,以获得更好的性能。一个典型的体系结构将检测和识别模块放置到单独的分支中,通常使用RoIpooling来让这些分支共享一个视觉特征。然而,当采用使用基于注意力的解码器和表示字符区域空间信息的检测器时,仍然有机会在模块之间建立更互补的连接。这是可能的,因为这两个模块共享一个共同的子任务,即查找字符区域的位置。
2022-11-15 10:36:54
313
原创 ABCNet:端到端的可训练框架的原理应用及优势对比
ABCNet(Adaptive Bezier Curve Network)是一个端到端的可训练框架,用于识别任意形状的场景文本。直观的pipeline如图所示。采用了单点无锚卷积神经网络作为检测框架。移除锚定箱可以简化我们任务的检测。
2022-11-07 16:30:17
299
原创 FOTS:端到端的文本检测与识别方法的原理应用与优势
基于深度学习的可端到端训练的自然场景检测与识别算法(text spotting)由于其简洁高效且统一的结构,逐渐取代了过去将检测与识别分阶段训练然后拼接在一起的方案,成为自然场景文本检测与识别的主流研究方向之一。端到端自然场景文本检测和识别网络一般都共享特征提取分支,根据提取的特征进行文本检测,然后将检测得到的文本特征送入识别模块进行文本识别。
2022-11-04 15:07:23
1548
原创 【文本检测与识别白皮书-3.2】第二节:基于注意力机制和CTC的场景文本识别方法的对比
本节内容给出基于CTC和基于注意力机制的两种场景文本识别方法,并给出各自的优势与局限性
2022-11-03 16:04:42
504
2
原创 【文本检测与识别白皮书-3.2】第一节:基于分割的场景文本识别方法
基于分割的识别算法是自然场景文本识别算法的一个重要分支(Wang 等,2012;Bissacco 等,2013;Jaderberg 等,2014),通常包括3 个步骤:图像预处理、单字符分割和单字符识别。基于分割的自然场景文本识别算法通常需要定位出输入文本图像中包含的每个字符的所在位置,通过单字符识别器识别出每一个字符,然后将所有的字符组合成字符串序列,得到最终的识别结果。
2022-10-31 14:12:41
437
原创 去屏幕纹用合合信息的这个技术,比操作PS软件省7个步骤
用相机拍摄电子屏幕,当感光元件像素的空间频率与影像中条纹的空间频率接近时,就可能产生摩尔纹。摩尔纹有呈条纹状、网状、波纹状等多种形态,颜色各异,纹理的走向和弧度也有差别。去除摩尔纹成为行业中颇具挑战性的任务,也是合合信息在智能文字识别领域里创新技术应用之一。
2022-10-28 14:05:16
298
原创 10分钟完成模型开发!合合信息智能文字识别服务平台亮相1024程序员节
近期,CSDN(中国开发者网络)第三届“1024程序员节”(简称“大会”)顺利举办,来自Linaro等开源组织的领导者和微软、腾讯、华为、合合信息等企业的技术专家接连登陆主论坛重磅活动《全体大会:2022技术英雄会》,与观众云端话科技。
2022-10-26 15:04:41
1027
原创 【文本检测与识别-白皮书-3.1】第四节:算法模型 2
SegLink提出一种新的文本检测策略,由一个简单和高效的CNN模型实现。在水平方向、面向方向和多语言的文本数据集上的优越性能很好地证明了SegLink是准确、快速和灵活的。在未来,将进一步探索其在检测弯曲文本等变形文本方面的潜力。此外,研究人员还想将SegLink扩展到一个端到端识别系统。
2022-10-24 16:59:21
843
1
原创 【文本检测与识别白皮书-3.1】第三节:算法模型
R-CNN、Fast R-CNN、Faster R-CNN2014年论文《Rich feature hierarchies for accurate object detection and semantic segmentation Tech report》提出R-CNN模型,即Regions with CNN features。这篇论文可以算是将CNN方法应用到目标检测问题上的开山之作。。。
2022-10-21 11:27:28
457
原创 【文本检测与识别白皮书-3.1】第二节:基于分割的场景文本检测方法
基于分割的自然场景文本检测方法主要是借鉴传统的文本检测方法的思想,先通过卷积神经网络检测出基本的文本组件,然后通过一些后处理的方式将文本组件聚集成一个完整的文本实例。此类方法可以进一步划分为像素级别的方法(基于分割的方法)和文本片段级别的方法。
2022-10-19 16:28:55
653
原创 【文本检测与识别白皮书-3.1】第一节:常用的文本检测与识别方法
考虑到将Faster R-CNN 用于文本检测时,矩形锚点框与文本的形状相差过大,会导致区域生成网络(region proposal network,RPN)在生成文本候选区域时效率不高,鲁棒性也不强,Zhong 等人(2019)因此借鉴了DenseBox(Huang 等,2015) 的思想,提出了不需要锚点框的区域生成网络(anchor-free region proposal network, AF-RPN)。基于深度学习的自然场景文本检测方法在检测精度和泛化性能上远优于传统方法,逐渐成为了主流。
2022-10-17 16:18:12
602
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人