• 博客(261)
  • 收藏
  • 关注

原创 真实场景文档理解:字节发布的WildDoc基准数据集向OCR提出了什么挑战?

本文讨论了字节跳动团队联合华中科技大学发布的 WildDoc 基准数据集对 OCR 能力的再衡量,分析了现有模型在真实场景文档理解中的性能瓶颈,探讨了自然场景文档解析的重要性及文档解析产品的应对方法。

2025-06-11 10:00:00 579 3

原创 从OCR到Document Parsing,AI时代的非结构化数据处理发生了什么改变?

本文讨论了在AI时代,非结构化数据处理从OCR到Document Parsing的改变,介绍了文档解析技术的概念、作用、典型应用等内容。

2025-06-09 10:00:00 2171 7

原创 TextIn OCR Frontend前端开源组件库发布!

PDF 文件源配置url?data?: Object;: boolean;password?: string;length?: boolean;

2025-06-03 10:00:00 1269 1

原创 合合信息首批通过中国信通院文档图像篡改检测平台能力完备性测评

据合合信息技术团队人员介绍,合合信息自研的篡改检测系统融合先进的图像处理技术与深度学习算法,能够高效、准确地识别各类凭证图像中的篡改行为,包括身份证、行驶证、驾驶证、银行卡、护照、中国港澳台通行证、商场小票等,并精确定位篡改区域。据悉,本次“护证计划”开展的文档图像篡改检测平台能力测评,旨在规范市场上的图像检测技术,提升行业整体的风险防范能力。AI技术发展日新月异,面对大模型等前沿技术带来的安全挑战,合合信息将持续优化图像篡改检测技术在多场景的应用,推动技术能力向规范化、普适化延伸。

2025-05-30 11:40:04 240

原创 论文解读 - 统一的多模态理解和生成模型综述(下)

大规模、高质量且多样化的训练数据是构建强大的统一多模态理解和生成模型的基础。这些模型通常需要在大量图像-文本对上进行预训练,以学习跨模态的相关性和表示。需要注意的是,在大规模多模态数据上进行训练之前,这些模型往往使用从大型自然语言语料库中训练得到的参数初始化,例如Common Crawl 1、RedPajama、WebText等。由于本综述主要关注多模态模型,因此本节讨论将不包括纯文本数据。

2025-05-30 10:00:00 941 5

原创 论文解读 - 统一的多模态理解和生成模型综述(上)

近年来,多模态理解模型和图像生成模型都取得了显著的进步。尽管各自取得了成功,这两个领域却独立发展,形成了独特的架构范式:基于自回归的架构主导了多模态理解,而基于扩散的模型则成为图像生成的基石。最近,人们越来越关注开发能够整合这些任务的统一框架。GPT-4的新能力正是这一趋势的体现,突显了统一的可 能性。然而,两个领域的架构差异带来了重大挑战。为了清晰地概述当前的统一努力,论文提供了一份全面的综述,旨在指导未来的研 究。首先,论文介绍多模态理解和文本到图像生成模型的基础概念和最新进展。接下来,论文回顾现有的统

2025-05-29 10:00:00 1485 10

原创 Coze扣子文档解析 VS. 专业OCR工具,RAG知识库性能评测!

Coze 平台解析和TextIn 文档解析,一款专业的 PDF 与图像解析产品。Coze 解析TextIn 文档解析数据集以企业年报与招股书文件为主体。原始数据集包括:年报 6 份,招股书 82 份。由于 Coze 不支持 500 页以上的 PDF 文件解析,数据集调整为:年报 6 份,招股书 67 份。测试集包含共322 项 QA 单问题,所有信息均来自年报与招股书文件。

2025-05-21 10:00:00 1032 7

原创 轻松get热播剧同款“数字名片”!合合信息名片全能王助力保险拓客

对于科技公司及创业者而言,名片全能王更是展示公司实力、拓展人脉的得力工具,通过多场景一键转发、全员名片统一管理等功能,帮助创业者大幅提升客户名片管理效率,降低客源流失风险。名片全能王能够帮助用户第一时间将自己的核心信息传递给对方,不仅提升了沟通效率,迅速建立客户信任,其强大的管理功能还可以高效整理客户信息,推动合作深入发展。同时,名片全能王还打破了多平台壁垒,支持微信、企业微信、钉钉、腾讯会议等多个即时通讯平台收发名片,实现数字名片无缝流转,大幅提升商务交流效率与便捷性。图说:名片全能王小程序功能示意图。

2025-05-20 15:01:58 223

原创 合合信息亮相2025中国图象图形大会,聚焦大模型时代的伪造图像检测

未来,合合信息也会持续关注和参与业界交流,秉持创新精神,深入钻研图像篡改检测技术,与行业伙伴携手共进,为构建安全、可信的数字世界贡献力量。自2006年创立以来,合合信息深耕图像安全领域,致力于推动行业规范化发展,牵头编制了《文本图像篡改检测系统技术要求》,围绕伪造图像鉴别、生成式图像判别等议题为行业提供有效指引,入选中国信通院“护证计划”首批技术支撑单位,助力金融、医疗等行业构建可信证照防伪体系。伪造图像检测面临数据获取与标注成本高、检测技术泛化能力有限、无痕篡改检测能力有限和伪造手段多样化等主要挑战,

2025-05-15 14:04:19 527

原创 LLM“力大砖飞”的时代,OCR专有模型还有意义吗?

本文讨论了在大模型(LLM)盛行的背景下,探讨OCR专有模型是否仍有意义,分析了大模型和小模型的区别、OCR专有模型存在的必要性、大小模型是否会相互替代以及它们的协同方式等内容。

2025-05-14 10:00:00 1280 6

原创 合合信息上线智能文档处理领域首批MCP服务,助力企业快速搭建Agent

据合合信息技术团队成员介绍,TextIn MCP Server系“大模型加速器”产品中,专为大模型下游任务设计的通用文档解析服务,能够识别并提取上千种文档中的跨页表格、合并单元格、密集表格、手写字符及公式,包括金融文档、国家标准、学术论文、财务发票等,解析稳定率达99.99%,单页处理耗时较行业可比产品降低超30%。基于领先的智能文档处理技术,旗下自研产品“大模型加速器”在复杂版面理解、表格及图表处理、内容溯源等能力上实现新突破,从数据源头降低大模型“幻觉”风险,让大模型在与人类的沟通中“更靠谱”。

2025-05-13 14:31:54 1071

原创 TextIn ParseX重磅功能更新:支持切换公式输出形式、表格解析优化、新增电子档PDF去印章

本文讨论了TextIn ParseX为适配多场景需求进行的功能更新与版本优化,介绍了新功能及优化内容,还给出使用途径和交流方式。

2025-05-12 10:00:00 1230 11

原创 TextIn MCP Server正式发布,无代码搭建智能文档处理Agent!

本文讨论了为实现智能文档处理任务与LLM更好交互,提高开发者接入效率与体验,TextIn MCP Server近日正式上线的相关事宜,介绍了其功能、接入方式及使用案例等。

2025-04-30 10:00:00 2081 13

原创 OCR技术难点解读:数学公式检测与识别

本文讨论了文档解析中数学表达式检测与识别(MEDR)这一自然语言处理和计算机视觉交叉领域的重要技术,介绍其技术难点、应用场景、发展历程及相关模型等。

2025-04-23 10:00:00 1202 15

原创 合合信息发布智能文档处理行业白皮书,破解文档处理效率与安全问题

白皮书》提到,AI“狂飙”的时代,图像造假的门槛变得越来越低,加强反制技术研究愈发迫在眉睫,合合信息的图像篡改检测技术为图像安全的守护发挥了重要作用。在数字化转型浪潮席卷全球的当下,企业面临着海量文档处理的难题,传统文档处理方式效率低、成本高、易出错,已无法满足企业发展的需求。在金融领域,智能文档处理技术通过对上市公司或银行发布的公告、年报等进行解析和处理,解决传统 PDF 解析工具存在的文本及阅读顺序、乱码、表格解析等痛点,抽取关键信息,为企业提供决策支持,助力金融信息化企业建设数据底座。

2025-04-17 10:31:21 365 2

原创 TextIn ParseX文档解析参数使用指南(第一期)

本文讨论了TextIn ParseX通用文档解析这款适配多样化场景的PDF解析工具,介绍了其常用参数的作用及使用方法。关键要点包括解析页码参数、分辨率参数、加密文档参数、标题目录参数、获取JSON结果参数、页面元素参数及表格输出参数。

2025-04-16 10:00:00 1264 15

原创 实测对比|法国AI独角兽公司发布的“最强OCR”,实测效果如何?

本文讨论了法国一家AI独角兽公司发布号称“全世界最好的OCR”产品A产品后,TextIn测试团队对其与TextIn文档解析工具进行对比测试的情况,涵盖测评指标、数据集、结果等内容。

2025-04-02 10:00:00 4565 11

原创 理解文字识别:一文读懂OCR商业化产品的算法逻辑

本文讨论了文字识别技术,尤其是OCR商业化产品的算法逻辑,介绍了其发展历史、核心任务中的文本检测和识别方法等。关键要点包括:OCR概念与溯源、文本检测、基于CTC损失的文本识别方法、基于序列到序列的文本识别方法。

2025-03-26 10:00:00 1350 19

原创 解析稳定率达99.99%!合合信息“大模型加速器2.0”助力AI打破“幻觉”

近期,上海合合信息科技股份有限公司(简称“合合信息”)TextIn“大模型加速器 2.0”版本正式上线,基于领先的智能文档处理技术,对复杂文档的版式、布局和元素进行精准解析及结构化处理,从数据源头降低大模型“幻觉”风险,让大模型在与人类的沟通中“更靠谱”。

2025-03-21 14:42:17 632 2

原创 【直播预告】“大模型加速器2.0”版本即将开箱!破解AI“幻觉”难题

但在实际应用中,企业有大量数据在PDF、扫描件、图片、网页等非结构化文档中,这些多来源、多格式、多版式布局的非结构化数据,很难被大模型准确解析,从而引发大模型生成式答案幻觉。随着DeepSeek的现象级爆发,越来越多的企业开始部署大模型搭建企业知识库,实现企业数据资产化,赋能在线客服、投保承保、智能投研、合规审计等多行业业务场景。

2025-03-18 21:27:44 442

原创 智能扫描助力节碳超13万吨,合合信息旗下扫描全能王“指尖减碳”写就绿色诗篇

近期,合合信息旗下扫描全能王发布了2024年度绿色扫描数据,用数字揭开了一场“指尖减碳”的浪漫之旅。未来,以扫描全能王智能扫描技术为代表的科技势能,将带动更多人完成“指尖上的减碳”,共同绘就生态文明建设的崭新画卷。

2025-03-18 10:00:00 429

原创 推理大模型时代,TextIn ParseX助力出版业知识资产重构

本文讨论了在推理大模型时代,出版机构的非结构化数据资产迎来新机遇,TextIn ParseX助力出版业知识资产重构及数据价值释放。关键要点包括:技术浪潮带来机遇、知识资产重构关键环节、TextIn文档解析优势、数据价值释放路径等。

2025-03-12 10:00:00 1641 21

原创 图表解析技术:逆向提取图表数据,需要哪几步?

对于我们时代的所有“PPT工作者”来说,图表是一位熟悉的“老朋友”了,但如何将各色报告或论文中的图表逆向转化为原始数据呢?本期内容中,我们将初步探讨图表解析技术的构成与发展历程。

2025-03-06 10:01:39 2121 22

原创 上海第二批49家创新型企业总部名单出炉,合合信息入选

近期,上海为新认定的第二批49家创新型企业总部进行授牌,上海合合信息科技股份有限公司成功入选第二批 49 家创新型企业总部名单,系人工智能领域获奖企业之一。

2025-02-28 14:21:58 367 1

原创 中国信通院“护证计划”正式启动,合合信息入选首批技术支撑单位

近日,由中国互联网协会中小企业发展工委会主办的“卓信大数据计划”2025年度会议在京召开。本次会议上,合合信息成功入选“护证计划”首批技术支撑单位。

2025-02-28 10:32:59 536

原创 合合信息与中科曙光签署合作协议,助力加速信创国产化进程

近日,上海合合信息科技股份有限公司与中科曙光于2025全球开发者先锋大会上举办签约仪式,双方将协力在关键行业与重点领域推进AI应用落地,共建易用、好用的信创生态。

2025-02-27 10:30:00 849

原创 从视觉到语义逻辑:版面分析技术浅析

文档版面分析(DLA)的研究始于20世纪90年代,进入21世纪后,DLA迎来了全新的发展与应用场景。本文将浅析DLA的各个方法路径,主要分为物理版面分析与逻辑版面分析两大类别。

2025-02-26 10:30:00 2331 6

原创 启信宝发布文旅产业洞察报告,商业查询技术洞察经济新增长极

近年来文旅产业蓬勃发展,文化古迹作为传统文化重要载体,正转变为融合文化、经济与科技的多元文旅地标。启信宝凭借领先商业查询技术发布的《文旅产业洞察报告》显示,全国文创文旅产业链相关存续企业近 74 万家,近三年新增约 27 万家,文创经济增长强劲。

2025-02-24 14:52:59 1563

原创 合合信息2025届春季校园招聘全面启动!

世界因你而AI,合合信息2025届春季校园招聘启动!

2025-02-21 10:53:06 202

原创 用户的声音 | 文档结构化信息提取方案测评:LLM、开源模型部署与云端API,谁是合适选择?

数据作为大模型时代的核心生产资料,其结构化处理能力直接影响AI系统的实用价值。本文将梳理主流技术方案,立足实际需求,结合一系列实测数据与实践经验,评估各方法在不同场景下的表现与优劣势。

2025-02-19 10:30:00 2014 14

原创 合合信息启信宝助力国家自然科学基金委员会重点专项推进

近日,国家自然科学基金委员会公布了2024年度宏观调控专项“数据市场制度设计与关键技术”的评审结果。

2025-02-14 10:30:00 554

原创 新功能内测!图表解析上线,一键帮助大模型读懂图表数据

TextIn文档解析上线新功能【图表识别】,目前已启动内测。图表识别功能可以智能解析图表属性Chart,并以Excel格式精准输出,帮助大模型深度理解图表的结构、趋势和数据逻辑,让数据分析更高效。

2025-02-13 09:30:00 1193 13

原创 大数据助力青年创业就业,启信宝获中国青年创业就业基金会感谢信

近日,中国青年创业就业基金会向启信宝发来感谢信,对启信宝在2024年对青年创业就业和全国经济普查工作的支持表示感谢。

2025-02-08 17:45:59 272

原创 首个世界“非遗版”春节来临,合合信息旗下扫描全能王助力手工达人“画蛇添福”

面对首个世界“非遗版”春节,合合信息旗下扫描全能王发起了“扫描全能王春节还能这样用”新春扫描活动,多位手工创作者通过AI扫描技术,记录属于春节的视觉符号。

2025-01-23 10:27:07 549

原创 合合信息旗下启信宝获商务部国际贸易经济合作研究院感谢信

近日,合合信息旗下启信宝收到了来自商务部国际贸易经济合作研究院的感谢信,对其在商务信用建设领域课题研究中的卓越贡献和大力支持表示高度认可与感谢。

2025-01-22 15:39:10 237

原创 文档图像矫正任务的前沿进展:引入Transformer、自监督框架的思路

随着文档智能处理的需求逐步升级,文档图像去畸变技术也在不断探索新的可能性。本文我们将讨论近年来文档图像矫正任务的前沿进展,分享一些我们正在关注的方向。

2025-01-22 09:30:00 1426 17

原创 合合信息名片全能王上架原生鸿蒙应用市场,成为首批数字名片类应用

近期,合合信息旗下名片全能王正式上线原生鸿蒙应用市场,成为首批上线的数字名片类应用,帮助用户用AI扫描、识别和管理名片,提高商务沟通和客户数据管理的效率。

2025-01-16 11:12:14 507

原创 版面分析技术研究方向:真实世界中更丰富的版面布局

在大模型应用日益普及的今天,版面分析技术的发展前景愈加广阔。TransDLANet方法以其创新的Transformer架构和自适应元素匹配机制,实现了对复杂文档布局更为精准的理解与分割,而M6Doc作为多格式、多语言和多标注类别的大规模数据集,支持了更加细致和全面的模型训练。

2025-01-15 09:30:00 1512 11

原创 你有一份待查收的TextIn文档解析内测邀请函!

近期,扫描全能王为便捷智能文档处理流程,TextIn文档解析推出内测版本,支持内置参数,完成去水印与切边矫正处理,有效提升解析准确率与输出结果质量。

2025-01-13 09:30:00 993 1

原创 企业流程自动化:AI技术加持,解锁高效运营

在AI技术的推动下,企业流程自动化正逐步成为现代企业管理不可或缺的一部分。文档解析、智能数据录入和票据自动化处理等工具,通过其精准的数据抽取能力和快速处理速度,极大地提高了企业的运营效率和服务质量。

2025-01-09 09:30:00 1464 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除