合合技术团队-CSDN博客

原创 5分钟自动化财报抽取：基于TextIn+Coze的实践方案

本文介绍了一种高效财报解析方案，结合TextIn的智能文档解析与Coze的自动化工作流，构建可处理多格式财报的机器人。方案通过TextIn xParse引擎解析PDF/扫描件为结构化JSON数据，利用Coze编排自动化流程，精准抽取资产负债表、利润表等复杂表格。文章详细阐述了架构设计、数据处理逻辑及关键实现策略，包括表格标题识别、跨页表格合并等特殊处理。该方案可显著提升财报处理效率，降低人工错误，并支持扩展为智能分析、多期对比等高级功能，为财务数字化提供可靠的技术支持。

2026-01-22 10:29:09 834 10

原创论文解读-你的LLM能够稳定推理吗？

本研究做出了两项重要贡献：首先，论文引入了G-Pass@k这一新的评估指标，该指标通过多次采样尝试连续评估模型性能，不仅衡量了模型的最高性能潜力，还评估了其稳定性。其次，论文推出了LiveMathBench，这是一个动态基准测试，包含了一系列具有挑战性的当代数学问题，旨在减少评估过程中的数据泄露风险。通过使用G-Pass@k对最先进的大型语言模型（LLM）进行广泛的实验，并结合LiveMathBench，论文提供了关于这些模型最大能力和操作一致性的全面见解。

2026-01-15 10:16:26 963 16

原创跨越AI落地“最后一公里”，合合信息推出多模态文本智能AI产品矩阵

合合信息发布多模态大模型创新产品，推动AI技术在各领域的商业化落地。其文档解决方案实现文档全周期智能服务；教育领域推出蜜蜂试卷等AI学习工具；健康领域发布饮食助手Appediet。企业级市场推出xParse和INTSIGDocflow产品，提升数据处理效率。启信慧眼AI原生应用已应用于多个行业，日均风险扫描超2000万次。公司将持续推进多模态文本智能技术研发，探索AI应用新机遇。

2026-01-14 15:57:06 289

原创活动获奖名单公布 | TextIn大模型加速器 +火山引擎，多语言文档处理挑战营

【TextIn大模型加速器 + 火山引擎】使用“TextIn智能文字识别产品”实现AI OCR智能识别商家认证审核方案，赋能企业数字化转型新时代。【TextIn大模型加速器 + 火山引擎】基于 Dify 构建企业智能文档中枢：技术文档问答+合同智审+发票核验一站式解决方案。【TextIn大模型加速器 + 火山引擎】基于 TextIn 与火山引擎豆包大模型的智能文档解析工作流构建与实践。【TextIn大模型加速器 + 火山引擎】用Coze+TextIn+飞书搭建智能合同审查工作流。TextIn 赋能！

2026-01-13 14:27:12 479 1

原创合合信息名片全能王携手中兴通讯，数字名片助力5000+员工高效连接

合合信息旗下名片全能王与中兴通讯合作，推出企业数字名片服务，解决传统纸质名片易丢失、客户信息难沉淀等问题。该服务支持多平台分发，统一管理客户资源，助力企业塑造专业形象。中兴通讯已有五千多名员工使用该服务，覆盖全球业务网络，实现跨地域高效传播。数字名片深度嵌入企业工作平台，优化商务沟通流程，提升人脉资源管理效率。

2026-01-09 10:33:59 326

原创启信宝短剧行业洞察：AI赋能、国企入局，短剧开启“精品化”之路

2025 年短剧行业迈入高质量发展新阶段，多部短剧播放量比肩头部长剧，大制作短剧频现。合《2025 短剧行业观察报告》，从多维度揭示其精品化发展密码。数据显示，短剧市场规模增长迅猛，2024 年达 505 亿元首超当年电影票房，相关存续企业超 35 万家且覆盖全产业链，近五年行业新增企业数量理性回调，同时约 26 家国央企入局推动行业从 “量” 转 “质”。

2025-12-23 13:43:31 350

原创合合信息TextIn联合亚马逊云科技打造医学科研“搭子”，全球文档一键“秒懂”

合合信息TextIn与亚马逊云科技联合推出医疗行业AI解决方案，应用于MDI平台。该方案通过文档解析、多语言翻译等技术，快速处理医疗文档，1.5秒可完成百页文档信息提取，支持50多种语言翻译，显著提升药企研发效率。目前已在药品全生命周期管理中应用，帮助医疗团队高效处理研究报告、审批资料等非标准化文档，加速药品上市进程。未来双方将继续深化合作，探索AI在医疗领域的创新应用。

2025-12-18 17:05:57 157

原创赢取千元奖品！TextIn大模型加速器+火山引擎，多语言文档处理挑战营正式启动！

赢取千元奖品！TextIn大模型加速器+火山引擎，多语言文档处理挑战营正式启动！

2025-12-18 10:18:41 242 4

原创论文解读-潜在思维链推理的全面综述

本文全面回顾了基于大语言模型（LLM）的潜在CoT推理。通过将推理从表面语言层面提升至潜在空间，这种推理方式能够实现更加抽象、高效和可扩展的推断。论文总结了关键方法，指出了主要挑战，并展望了未来的发展方向。论文希望这篇综述能为这一新兴领域提供基础支持，并为该领域的进一步探索提供有价值的见解。

2025-12-03 10:00:00 924 10

原创启信宝《2025全国采购地图》：藏在县城的“隐形冠军”，撑起你的购物车

今年"双十一"凸显县域产业带正从幕后走向台前。启信宝《2025全国采购地图》显示，湖南平江辣条、河南柘城培育钻石、山东曹县汉服等县域产业集群正成为中国制造新引擎。其中，平江已形成完整辣条产业链，柘城培育钻石产能占全球70%，曹县汉服通过知识产权创新应对山寨挑战。这些县域产业带正从单纯成本优势向供应链、技术、品牌等综合优势转型，威海渔具、许昌假发等更多"隐形冠军"正在浮现，共同支撑起中国经济的产业深度和发展韧性。

2025-11-20 14:45:57 544 1

原创论文解读-对话中的多模态情感识别综述

本调查对MERC领域进行了结构化的回顾，比较了代表性方法，并突出了关键的开放研究问题。作者希望它能作为实用参考，支持未来开发稳健且包容的情感识别系统。

2025-11-19 10:00:00 1389 11

原创论文解读 - 大型多模态模型中现实世界个性化基准测试

本文中，论文提出了MDI基准测试，这是一种评估大型多模态模型（LMMs）在多维度场景中解决实际人类需求能力的工具。该基准测试包含超过500张图像和1200个相关需求，涵盖了人类生活的六大方面。此外，论文引入了年龄分层和基于老年人、中年人及年轻人需求的抽样问题，以确保评估的全面性。

2025-11-12 10:00:00 1647 17

原创让大模型一键“读懂”全球文档，合合信息携手火山引擎打造AI智能体新范式

摘要：中国信通院数据显示国内已发布大模型超1500个，推动技术落地成为行业关键。合合信息与火山引擎合作推出升级版"大模型加速器"，通过高效文档解析技术解决企业非结构化数据处理难题，支持99.99%的复杂文档解析。平台提供分层服务方案：HiAgent面向企业定制化需求，Coze降低开发者门槛。支持多种部署方式，推动AI在医疗、金融等领域的应用落地，加速大模型从实验室走向实际生产。

2025-11-11 14:22:30 388

原创启信宝获得法博会“行业洞见奖”，相关服务即将登陆“深律通”

2025深圳法律服务博览会成功举办，聚焦"法律创新护航科技与产业创新"主题。合合信息旗下启信宝凭借法律科技创新应用，获深圳市律师协会颁发的"行业洞见奖"。该产品将通过"深律通"APP向全市律师开放，提供企业多维数据查询及智能风险分析服务，助力法律行业数字化转型。启信宝整合商业大数据，开发股权穿透、关联图谱等功能，显著提升律师尽调、风险评估效率，并探索AI技术在法律场景的深度应用。

2025-11-05 16:47:17 235

原创合合信息与上海交通大学开展课题合作研究，共探智能文档图像处理前沿技术

计算机视觉领域迎来新突破，合合信息与上海交通大学联合举办的首届VQualA视觉质量评估研讨会及文档图像质量评估竞赛在ICCV2025期间举行。会议聚焦智能文档图像处理技术标准化评估，吸引了全球上百名选手参与。竞赛中，DeQA-Doc团队的多模态大模型方案表现优异，成功将图像质量评估技术延伸至文档图像领域。面对数字化时代文档图像质量评估的挑战，此次活动旨在推动AI技术与产业应用的深度融合。

2025-10-27 15:01:33 422

原创多模态文本智能大模型前沿技术与应用论坛在上海召开，合合信息推出多模态文本智能技术方案

第八届中国模式识别与计算机视觉学术会议（PRCV2025）聚焦多模态文本智能大模型发展，探讨前沿技术与应用。专家提出"多模态思维链"技术提升跨模态推理能力，OCR幻觉缓解方案优化文本感知。合合信息推出"多模态文本智能技术"方案，通过空间位置理解实现多模态信息立体化处理，已在金融、医药等领域应用。该技术突破传统文档处理局限，构建"感知-认知-决策"新范式，推动AI从工具向业务伙伴进化。小红书、甲骨文研究等案例展示了技术在实际场景中的创新应用价值。

2025-10-21 17:46:59 599

原创启信宝电影行业洞察：广东蝉联“双冠王”，票房与企业数量全国第一

2024年中国电影市场呈现两极分化：观影人次下滑23.1%，但电影企业数量五年翻三番。行业正从规模扩张转向结构升级，资源加速向头部企业和核心区域聚集。动画电影头部效应显著，彩条屋等三家头部公司占据80%市场份额。广东成为最大票仓和产业聚集地，影院数量占全国17%。AI技术快速渗透电影产业，相关企业六年增长4.3倍，应用覆盖制作全流程。行业正经历深度调整，向工业化、智能化方向发展。

2025-10-20 15:26:11 479

原创合合信息获首批“个人信息保护合规审计自审计能力评价”最高等级认证

在国家施行《个人信息保护合规审计管理办法》背景下，合合信息凭借完善的数据安全管理体系，荣获首批"个人信息保护合规审计自审计能力（规范级）"评价证书，这是评审活动中的最高等级认证。

2025-09-25 14:04:45 333

原创合合信息获2025年中国网络安全创新创业大赛奖项，打造多模态AI鉴伪方案

合合信息自研产品“基于多模态一致性检验的图像智能鉴伪系统FidOK”从上百家参赛企业中脱颖而出，荣获大赛奖项，为AI时代下的图像安全保驾护航。

2025-09-17 14:07:23 335

原创扫描全能王“翻页自动拍”功能上线，AI扫描提升教师教学材料电子化效率

扫描全能王推出"翻页自动拍"功能，助力教师节教学资料电子化。该功能通过AI技术自动捕捉翻页动作，准确率达97%，较传统扫描方式节省20%时间，可智能去除手指、阴影等干扰因素，实现连续拍摄并生成高清电子文档。该功能适用于教育、法律、医学等多领域，配合教师认证权益计划，帮助教师从繁琐的文档处理中解放，专注教学工作。

2025-09-10 14:27:27 502

原创合合信息参编《数据产业图谱（2025）》，助力绘制中国数字经济发展新蓝图

合合信息作为核心参编单位，凭借启信产业大脑的产业链数据库（覆盖32个行业、5500万企业主体）提供重要支撑。图谱揭示数据应用领域企业占比最高（24%），并指出数据资源企业加速增长、产业集中度提升等趋势。合合信息新推出的智能产业研究分析功能，通过自动化产业图谱构建和洞察分析，为政企机构提供更强大的决策支持，助力数字经济发展。

2025-09-02 14:59:51 433

原创 RAGFlow+TextIn：RAG实战教程！1分钟实现解析性能提升

针对原生解析器在复杂文档处理中的不足（如表格识别错误、阅读顺序错乱等问题），提出采用商业化解析工具TextInxParse的解决方案。文章详细对比了开源与商业化解析工具的优劣，并提供了两种集成方案：通过API直接上传解析结果，或修改RAGFlow源码实现深度集成。重点展示了如何通过代码修改替换原生解析模块，实现表格精准识别、多栏文档顺序还原等能力提升。实际测试表明，该方法显著提高了知识库构建质量，为后续检索和生成环节奠定了更好的基础。文末还探讨了切片策略等进一步优化RAG系统性能的可能性。

2025-08-25 11:34:22 1327 10

原创启信宝宠物行业报告：6年增10倍！超400万家企业抢滩千亿“毛孩子经济”

2025年亚洲宠物展揭示千亿级"毛孩子经济"新趋势。数据显示，中国宠物市场规模2024年达3880亿元，预计2025年突破4500亿，相关企业6年增长10倍至409.9万家。宠物医疗获53%融资占比，成为资本新宠。区域布局呈现特色：海南领跑新兴消费，山东稳坐"宠物粮仓"。新型服务快速崛起，宠物摄影和运输企业分别增长14倍和25倍。

2025-08-20 14:47:44 608

原创合合信息智能审核白皮书上线，AI破解审核业务“数据孤岛”难题

合合信息发布智能审核白皮书，针对金融、财务、供应链等场景推出AI智能审核解决方案。传统人工审核面临效率低、成本高、错误率高等问题，尤其在跨境金融等复杂场景中，多系统数据孤岛和复杂版式文档处理困难。合合信息的AI系统支持多版式文档解析、跨系统数据比对，在财务场景实现全流程自动化，账单识别准确率达98%以上。其标准化产品TextInDocFlow提供一站式智能文档处理，支持API等多种集成方式。

2025-08-08 11:00:00 701

原创告别碎片化输入：TextIn xParse如何为RAG打造「零损耗」知识管道

TextInxParse智能文档解析引擎是提升RAG系统效能的关键工具。它通过深度结构化解析，精准还原PDF、Word等文档的标题层级、表格数据、跨页内容等复杂元素，输出标准化的Markdown/JSON格式。相比传统OCR，该工具能显著提升检索效率30%以上，确保答案准确性，并完整保留关键信息。其核心优势包括：行业领先的表格识别能力（支持合并单元格、跨页表格等）、多语言支持、图像处理功能，以及开发者友好的API集成。典型应用场景涵盖金融报表解析、学术内容重建、医疗数据处理等领域。通过提供结构化数据输入，T

2025-08-06 10:00:00 1211 7

原创参会邀请！2025世界人工智能大会&合合信息技术交流日报名启动！

2025世界人工智能大会即将开幕，合合信息邀请您一起参与KOL深度技术交流活动。本次活动不仅可以带您逛展2025世界人工智能大会，在合合信息展台体验AI黑科技，还可以与行业顶尖技术专家面对面交流，共同探讨当下热门AI安全话题。即可报名，报名成功后我们会有专人联系。不仅可以收获WAIC单日门票一张，还可以get合合信息精美伴手礼哦，期待现场与你相见！详细活动安排请戳下图，点击。

2025-07-18 16:44:41 512 3

原创文档抽取进入「说人话」时代：用Prompt就能提取发票、合同、简历的关键信息

根据《福布斯》技术委员会的研究，企业仍封存于非结构化文档中，全球企业每年都要因手动处理发票、合同、报告产生代价高昂的效率损耗。在此情况下，成为一项极其重要的基础能力，它将PDF扫描件、医疗影像报告、物流单据等“不可用数据”实时转化为可计算、可分析的燃料，重构数据价值链：例如，：改变人工核验方式，自动从身份证、收入证明、银行流水、税单中提取关键信息（姓名、ID、收入、支出、账户信息），加速审批流程。

2025-07-09 10:00:00 2116 7

原创扫描全能王联合上海电影博物馆发起特色探馆活动，AI助力存档百年光影

本次探馆活动设置了多个打卡点，参与者可以用扫描全能王扫描《上海电影制片厂生产手册》、电影海报、宣传单等众多见证中国电影历史发展的珍贵文档，不仅可以了解电影背后的时代精神和民族文化，助力电影文化传承，还可以用AI扫描技术构建起关于电影的私人记忆库，在日常生活中随时搜索扫描文档中的关键内容，真正把电影知识“带回家”。与最新的科技手段结合，激发创意火花，探索电影博物的无限可能，是上海电影博物馆开馆12年来一直坚持的事情，本次借助扫描技术的创意观展路线，让电影的精神走进观众的日常生活，传播真善美的力量。

2025-07-02 15:48:48 428

原创搭建Coze扣子文档智能问答Bot工作流，保姆级教程来了！

在信息爆炸的今天，我们常常被淹没在各种文档之中——产品手册、技术白皮书、合同条款、内部报告……快速精准地从文档中提取所需信息，是提升日常工作效率的关键。这时，可靠的就能成为我们的得力助手。文档智能问答机器人能够将静态文档转化为动态知识库，比起原先埋头文档中靠自己阅读记忆，现在我们只需向Bot提问，它就能快速定位并输出文档中相关的精确答案或关键段落。：面对冗长的合同，直接询问“付款周期是多久？”或“违约责任条款有哪些？”，Bot能迅速给出答案，省去逐页查找的麻烦。

2025-07-02 10:44:28 1857 5

原创文档解析工具API表格提取完全指南：从坐标迷雾到精准裁剪

在数字化办公的过程中，我们经常遇到这样的需求：例如，财务报表系统要从PDF财务报告中提取表格，生成独立的图片文件，需要精准地提取表格区域，保持原始格式。再如，企业需要批量处理合同、发票中的表格信息，输入文档归档系统，因而要求无损提取表格图片，确保信息完整性。前端工作中，系统或页面要实现移动端适配也遵循相似的逻辑，由于原始表格在小屏幕上显示效果差，需要将复杂表格转换为高清图片，便于在手机上查看。

2025-06-30 11:17:00 744 5

原创启信宝联合六大数交所共同编制，《企业数据治理实践白皮书》发布

近期，第三届粤港澳大湾区国际数据交易周在深圳举办。本届活动由深圳数据交易所主办，以“数聚湾区，智启新程”为主题，聚焦数据要素市场化配置改革、数据跨境流通及数据资产化等前沿议题。会上，合合信息旗下启信宝正式发布了《企业数据治理实践白皮书》（下文称“白皮书”）。

2025-06-24 14:44:59 886

原创合合信息发布业内首个AI Agent跨平台云资源智能管理终端

在当今以数据驱动和云原生为核心的技术浪潮中，数据库、服务器等云资源如同“数字时代的电力”，成为企业开发应用、存储数据等业务的基石。随着云计算产业规模不断扩大，如何高效有序管理云资源成为了难题。近期，2025亚马逊云科技中国峰会在上海顺利召开，深度聚焦云计算与生成式AI的技术融合趋势。大会上，上海合合信息科技股份有限公司（以下简称“合合信息”）发布了业内首个AI Agent跨平台云资源智能管理终端Chaterm，通过打造“对话式终端管理工具”，帮助云计算从业人士实现云资源的智能化和规模化管理。

2025-06-20 10:00:00 1474

原创中高考季，盘点AI文档工具有哪些实用的创新？

中高考甫落帷幕，今年的考生终于松一口气，而学校、老师们仍在紧锣密鼓地研究试题、评估考分。在人工智能的浪潮下，AI 押题、AI 判卷等应用纷纷各显神通，AI 文档工具成为一项学习利器，其中哪些创新具有实用、好用的特点呢？今天，我们将介绍智能文档处理工具 TextIn 在学习领域的新功能，来看看：哪一项是你需要的？

2025-06-18 10:00:00 1755 8

原创真实场景文档理解：字节发布的WildDoc基准数据集向OCR提出了什么挑战？

本文讨论了字节跳动团队联合华中科技大学发布的 WildDoc 基准数据集对 OCR 能力的再衡量，分析了现有模型在真实场景文档理解中的性能瓶颈，探讨了自然场景文档解析的重要性及文档解析产品的应对方法。

2025-06-11 10:00:00 1073 3

原创从OCR到Document Parsing，AI时代的非结构化数据处理发生了什么改变？

本文讨论了在AI时代，非结构化数据处理从OCR到Document Parsing的改变，介绍了文档解析技术的概念、作用、典型应用等内容。

2025-06-09 10:00:00 2524 7

原创 TextIn OCR Frontend前端开源组件库发布！

PDF 文件源配置url?data?: Object;: boolean;password?: string;length?: boolean;

2025-06-03 10:00:00 1477 1

原创合合信息首批通过中国信通院文档图像篡改检测平台能力完备性测评

据合合信息技术团队人员介绍，合合信息自研的篡改检测系统融合先进的图像处理技术与深度学习算法，能够高效、准确地识别各类凭证图像中的篡改行为，包括身份证、行驶证、驾驶证、银行卡、护照、中国港澳台通行证、商场小票等，并精确定位篡改区域。据悉，本次“护证计划”开展的文档图像篡改检测平台能力测评，旨在规范市场上的图像检测技术，提升行业整体的风险防范能力。AI技术发展日新月异，面对大模型等前沿技术带来的安全挑战，合合信息将持续优化图像篡改检测技术在多场景的应用，推动技术能力向规范化、普适化延伸。

2025-05-30 11:40:04 580

原创论文解读 - 统一的多模态理解和生成模型综述（下）

大规模、高质量且多样化的训练数据是构建强大的统一多模态理解和生成模型的基础。这些模型通常需要在大量图像-文本对上进行预训练，以学习跨模态的相关性和表示。需要注意的是，在大规模多模态数据上进行训练之前，这些模型往往使用从大型自然语言语料库中训练得到的参数初始化，例如Common Crawl 1、RedPajama、WebText等。由于本综述主要关注多模态模型，因此本节讨论将不包括纯文本数据。

2025-05-30 10:00:00 1296 5

原创论文解读 - 统一的多模态理解和生成模型综述（上）

近年来，多模态理解模型和图像生成模型都取得了显著的进步。尽管各自取得了成功，这两个领域却独立发展，形成了独特的架构范式：基于自回归的架构主导了多模态理解，而基于扩散的模型则成为图像生成的基石。最近，人们越来越关注开发能够整合这些任务的统一框架。GPT-4的新能力正是这一趋势的体现，突显了统一的可能性。然而，两个领域的架构差异带来了重大挑战。为了清晰地概述当前的统一努力，论文提供了一份全面的综述，旨在指导未来的研究。首先，论文介绍多模态理解和文本到图像生成模型的基础概念和最新进展。接下来，论文回顾现有的统

2025-05-29 10:00:00 1715 10

原创 Coze扣子文档解析 VS. 专业OCR工具，RAG知识库性能评测！

Coze 平台解析和TextIn 文档解析，一款专业的 PDF 与图像解析产品。Coze 解析TextIn 文档解析数据集以企业年报与招股书文件为主体。原始数据集包括：年报 6 份，招股书 82 份。由于 Coze 不支持 500 页以上的 PDF 文件解析，数据集调整为：年报 6 份，招股书 67 份。测试集包含共322 项 QA 单问题，所有信息均来自年报与招股书文件。

2025-05-21 10:00:00 1658 7

空空如也

空空如也