自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 ⚠️OCRFlux 实战避坑记录:被 ChatDOC 演示效果“骗”了的72小时

《OCRFlux实战踩坑记:开源模型与商业产品的巨大差异》 摘要:从PaddleOCR切换至OCRFlux时遭遇效果落差,发现开源版本(OCRFlux)与官网演示(ChatDOC PDFParser)存在本质区别:前者仅支持基础Markdown转换,后者具备结构化抽取、嵌套表格等高级功能。实际部署后遇到输出截断、缺失坐标信息、长文档处理不足等问题。经验表明OCRFlux适用于中小文档转换,而复杂场景需商业版本。该案例警示开发者需仔细区分开源demo与商业产品的功能差异。

2025-07-14 11:23:21 1262 1

原创 OCR识别神器 行业颠覆者 OCRFlux 只能说真牛逼

OCRFlux是一款颠覆性的开源OCR工具,专为解决复杂文档识别难题而生。传统OCR在财务表格等复杂场景表现不佳,而OCRFlux凭借多模态设计和深度优化,能准确识别148个字段的资产负债表,连跨页内容和文档布局也能完美处理。该项目由chatdoc-com团队开发,针对PDF转Markdown场景进行了特别优化,初始模型表现就远超商业方案。开发者正计划将其部署到自有GPU服务器,用于财务和法律文档处理。OCRFlux有望成为AI项目中提升输入质量的关键利器,特别推荐给需要处理复杂表格的开发者尝试。

2025-07-10 11:38:42 563 2

原创 # Dify插件开发实录:下载模板文件的困境与探索

作为一名插件开发者,我最近在基于Dify平台开发一个Word模板填充插件时,遇到了不少“坑”和挑战,特地记录下来,分享给同行和社区,也希望能激发大家一起探讨。尝试用`requests.get(url, timeout=10)`下载模板文件时,代码执行后,日志显示请求完成,但插件整体卡住,无法继续返回任何消息。插件需要支持用户通过传入模板文件的URL或Base64编码,下载或解码模板文件,然后用用户给定的变量替换模板中的占位符,最终生成Word文件返回。- 插件内部只处理已上传的文件,避免下载卡顿。

2025-07-01 11:24:50 873

原创 Dify插件 自定义导出 Excel 单元格合并 加粗 换行 行高 列宽 完全自定义样式

说实话,做这个插件之前没想到能帮到这么多人。现在看到群里有人问"Excel导出怎么搞",我都直接甩这个插件:"拿去,不谢!开发过程中最大的感悟:​​程序员最爽的时刻,就是用自己的代码解决了自己的痛点​​。虽然这插件可能还有bug(毕竟我头发不多),但至少现在导Excel再也不用抓狂了。要是大伙有啥需求或者遇到问题,直接GitHub上提issue,看到必回!(当然最好先给个star,你懂的😏)

2025-06-23 09:37:37 3020 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除