- 博客(9)
- 收藏
- 关注
原创 文档提取器报错:Failed to extract text from PPTX: [Errno 111] Connection refused
报错:Failed to extract text from PPTX: [Errno 111] Connection refused。
2025-12-29 11:51:16
199
原创 Git 正确提交流程以及注意
Git正确提交流程摘要(150字) 使用Git提交代码时,需确保:1) 通过git remote -v确认当前仓库地址正确;2) 使用git branch检查当前分支;3) 用git fetch和git pull同步远程更新;4) 修改后git add、git commit提交更改;5) 用git push推送到正确远程分支。关键要确认仓库地址和分支无误,避免误提交到错误位置。每次提交前应检查状态(git status)和差异(git diff),确保代码同步后再推送。
2025-10-29 16:15:06
320
原创 mineru-2.5.4 更新
MinerU 在 2025 年 9 月至 10 月初期间经历了显著的开发活动,以重要版本发布、架构改进和持续的社区参与为标志。MinerU 中的 VLM(视觉语言模型)后端架构提供了一个复杂的多模态文档分析框架,结合视觉和语言能力从 PDF 文档中提取结构化内容。MagicModel 类 vlm_magic_model.py 作为主要的转换引擎,将 VLM 输出转换为结构化的文档块。批量推理:通过选定的后端使用 batch_two_step_extract() 处理图像。
2025-10-10 15:06:16
1196
原创 “file in input form must be a file”报错
1.此处是在http:// ......../workflows/run中使用的多个文件上传的json格式,注意每个key需要与dify开始参数一致,且已发布。2.内容中的upload_file_id,是两个文件分别在http:......v1/files/upload上上传成功返回文件id ,填写到此处。//te_input,st_input是两个文件,分别上传,会有文件id,将两个文件id 填写在upload_file_id里面。
2025-09-30 11:19:03
533
原创 OPPO AI Agent 团队推出 Chain-of-Agents:通过多智能体蒸馏与智能体强化学习构建端到端智能体基础模型
OPPO AI Agent 团队的Chain-of-Agents工作,是一次从范式到技术的全面创新。他们提出的范式,成功地将多智能体系统的强大协作能力,无缝地集成到单个LLM的端到端推理中,解决了效率与能力的矛盾。通过多智能体蒸馏和智能体强化学习,他们训练出了强大的,在多个领域树立了新的性能标杆。更重要的是,他们将模型权重、训练代码和数据集全部开源。这一举动不仅降低了研究门槛,更可能催生一个全新的研究生态。不仅仅是一个技术突破,它更像是一块基石。
2025-08-21 11:25:27
2155
原创 gpt-oss-120b & gpt-oss-20b Model Card
OpenAI最新开源了gpt-oss-120b和20b两款混合专家(MoE)Transformer模型,基于GPT-2/3架构优化,采用MXFP4量化技术实现单卡可运行(120b模型60.8GB)。模型具备三级可调推理能力,支持网页浏览、Python执行等工具调用,在STEM和编程任务上表现优异(120b接近o4-mini水平)。安全评估显示其默认版本未达高风险阈值,但存在指令层级易绕过、思维链可能产生幻觉等问题,需开发者自行补充安全措施。模型采用Harmony Chat格式管理对话流程,开源了完整权重和A
2025-08-08 15:21:44
1943
原创 NL2SQL新坑
将数据库中的表,参考文章,以及包含的各种字段写成文档,上传到知识库,作为知识检索,然后用agent做模型的识别,以及读取数据库,SQL生成语句,然后使用ROOKIE模块可以查询生成的SQL的语句直接去数据库取语句。2.知识库:3.AGENT(参考文章【1】,配置database,然后做agent动态规划React策略, prompt 要记得给模型来说明各个表的细节)参考文章【3】,此处需要先对生成的SQL进行模板转换,及output中只存在SQL语句,然后连给查询数据,参考文章。
2025-07-23 17:56:28
371
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅