自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 百度PaddleOCR-VL调研报告

PaddleOCR-VL采用两阶段架构设计,将复杂的文档解析任务拆解为布局分析与元素识别两个核心环节,配合轻量级后处理模块实现结构化输出,整体架构兼具灵活性与高效性。

2025-11-19 21:49:01 1251

原创 阿里Dingtalk-DeepResearch多智能体框架调研报告

Dingtalk-DeepResearch定位于企业级自适应智能框架,针对企业场景中数据来源异构(长文档、半结构化表格、知识图谱、多媒体)、查询需求复杂(跨域多跳推理、上下文关联)、部署要求严苛(隐私安全、业务流程集成)等痛点,提供端到端的智能研究与决策支持能力。其核心目标是实现AI从"被动响应"到"主动执行"的跨越,成为企业员工的智能协作伙伴。Dingtalk-DeepResearch的算法体系围绕"自适应进化"与"多模态推理"两大核心构建,涵盖四大关键技术模块,形成从训练到部署的全链路技术支撑。

2025-11-18 20:35:36 1059

原创 表格结构识别技术调研报告

在数字化转型加速推进的背景下,表格作为数据存储与呈现的核心载体,广泛存在于金融账单、医疗报告、政务文件等各类场景中。表格结构识别技术通过解析表格的行列边界、单元格关联关系及内容归属,实现从图像格式到可编辑数据的自动化转化,成为突破人工录入瓶颈的关键支撑。本报告系统梳理表格结构识别技术的发展路线,重点阐述各阶段典型技术及其核心原理,为相关技术研究与应用提供参考。

2025-11-17 21:48:40 933

原创 表格结构识别技术发展调研报告:从传统方法到大模型时代

表格结构识别技术经历了从规则驱动到数据驱动再到认知理解早期传统方法依赖于手工设计的规则和特征,在简单表格上效果良好但泛化能力有限。深度学习方法通过端到端特征学习,显著提升了对复杂表格结构的适应能力,成为当前主流技术。大模型时代的统一化基础模型则进一步整合了感知与认知能力,为实现全面表格理解奠定了基础。

2025-11-17 21:23:46 848

原创 Prompt 使用技巧全景综述

Prompt(提示词)是向大语言模型(LLM)传递任务目标、约束条件与背景信息的指令集合,是用户与模型间的 “沟通桥梁” 和 “指挥蓝图”。其核心价值在于激活模型特定领域知识、搭建推理框架、规范输出结构,消除需求歧义,让模型精准捕捉用户意图,最终提升输出质量与工作效率。无论是基础的信息查询、内容创作,还是专业的编程辅助、数据分析、医疗分诊等场景,高质量 Prompt 都能显著缩小 “用户预期” 与 “模型输出” 的差距。

2025-11-15 17:06:03 1367

原创 人工智能在军事场景应用的调研报告

例如,美军"专家"(Maven)智能系统作为国防部最显着的人工智能工具,专门处理无人机传回的影像和全动态视频,通过结合传感器、人工智能和机器学习,现代化 battlefield 作战,包括目标定位、后勤规划和预测部署部队的供应需求。据美空天军战争研讨会透露,AI可管理复杂、动态和通信降级的环境,处理作战层级的混乱事件(如飞机调度、基地受损、弹药不足),提供实时全局态势信息,整合多源数据(包括飞机状态、跑道、雷达、武器系统、敌方动态)。:作为军事AI技术领先的国家,中美等大国的协调对全球稳定至关重要。

2025-11-14 14:26:40 1253

原创 驭风而行:AI时代下金融从业者的角色重塑与不可替代性

本文的核心论点是:AI并非职业的终结者,而是强大的工具,它将重塑而非取代金融从业者,催生人机协同的新范式,将金融从业者从繁琐的执行中解放,转而聚焦于更高价值的战略与创新活动。答案并非简单的“是”或“否”。本文旨在穿透争议的迷雾,通过分析AI的应用现状与影响,并深刻剖析人类智能的独特优势,论证金融从业者如何在AI的浪潮中驭风而行,实现价值的升华与角色的重塑。综上所述,AI在金融领域的应用是一场深刻的“效率革命”,它自动化了重复性、计算性和标准化的任务,从而不可避免地重塑了金融从业者的工作内容。

2025-11-13 18:30:05 899

原创 AI如何改变IT行业:应用现状与从业者影响分析

人工智能技术正以前所未有的速度重塑IT行业的各个领域。2024年,《人工智能+》首次提出,标志着AI正式成为产业升级的核心驱动力。随着生成式AI技术的成熟和应用深化,AI已从辅助工具逐步演变为IT工作流程中的核心组成部分,深刻改变了软件开发、系统运维、安全保障等传统IT工作模式。本文将详细阐述AI在IT行业具体领域的应用现状,以及对IT从业者工作内容产生的实际影响。

2025-11-12 20:34:58 387

原创 【去红章+倾斜校正】在财报解析中的应用

在金融财报解析中,图像预处理是不可或缺的关键步骤,尤其在处理扫描或拍摄的财务报告时。原始图像常包含干扰元素,如红色印章(盖章或水印)和倾斜(由于扫描角度不正),这些因素会严重降低光学字符识别(OCR)的准确性和后续数据分析的可靠性。通过“去红章”操作,可以有效去除印章区域,避免OCR引擎将其误识别为文本内容,从而减少错误率;这些预处理技术不仅优化了数据提取的效率,还确保了金融分析结果的准确性和可信度,为风险评估、投资决策等应用提供了坚实基础。

2025-11-12 18:12:29 344

原创 多模态大模型在表格识别中的应用调研报告

表格作为结构化信息的重要载体,广泛存在于财务报表、科研文献、政府公文等场景中。(Table Structure Recognition, TSR)与。近年来,随着多模态大模型(Multimodal Large Language Models, MLLMs)的迅速发展,端到端、一体化的表格理解能力成为可能。本报告系统梳理当前主流方法,重点分析多模态大模型在表格识别中的能力边界与技术路径。

2025-11-10 21:25:44 1136

原创 基于vLLM部署paddleOCR-VL过程记录

ubuntu22RTX3090显卡miniconda。

2025-11-09 15:44:49 621

原创 测试第一次发帖看是否可行

【代码】测试第一次发帖看是否可行。

2025-11-07 16:38:40 263

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除