自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 问答 (1)
  • 收藏
  • 关注

原创 行业Agent记忆:从功能分类到实现路径

记忆分类明确:短期记忆维护会话上下文,长期记忆实现跨会话持久化技术路线多元:向量检索、知识图谱、OS式管理各有适用场景框架生态成熟:Mem0、Zep、Letta等框架已具备生产可用性性能显著提升:专用记忆层相比全量上下文,延迟降低13倍,Token节省90%安全不容忽视:记忆安全已成为Agent大规模落地的关键瓶颈国内生态崛起:腾讯云、阿里云等厂商推出企业级记忆方案。

2026-05-08 23:25:16 499

原创 Agent记忆管理:从短期记忆到长期记忆的认识

Agent记忆管理技术摘要 Agent记忆管理是AI智能体实现持续学习和个性化交互的核心能力,包含短期记忆和长期记忆两个层级。短期记忆绑定会话生命周期,用于维护对话上下文;长期记忆跨会话持久化,存储用户偏好和关键信息。技术实现上采用分层架构: 短期记忆通过内存缓存和Checkpointer机制实现 长期记忆依赖向量数据库进行语义化存储和检索 跨会话记忆通过BaseStore实现用户级状态管理 关键实现包括: 内存检查点(InMemorySaver)维护会话状态 向量数据库(如Chroma)支持语义搜索 自定

2026-05-07 00:08:33 359

原创 Agent记忆管理-人类记忆的后半段

Agent记忆管理技术正在从简单的状态维护发展为复杂的智能记忆系统。通过合理的架构设计、安全治理和性能优化,我们可以构建出强大、可靠、高效的AI记忆管理系统。关键要点回顾记忆分类明确:短期记忆维护会话上下文,长期记忆实现跨会话持久化技术架构完善:Checkpointer机制 + 向量数据库 + BaseStore的完整解决方案安全治理重要:权限控制、隐私保护、生命周期管理的企业级考量性能优化关键:记忆压缩、缓存策略、衰减机制的系统性优化监控调试必要:使用监控、质量评估、问题诊断的生产环境要求。

2026-05-06 23:59:50 724

原创 多模态文搜图图搜图:视觉语义检索的边界

本文介绍了基于LlamaIndex框架的多模态视觉语义检索技术,重点探讨了从传统文档检索到跨模态检索的技术演进。文章分析了传统解决方案(文件名搜索、OCR提取、人工标签)的局限性,提出了多模态RAG的核心思想——统一向量空间,通过CLIP双编码器实现文本和图像在同一语义空间中的比较。技术架构分为四个演进阶段:基础(CLIP+Milvus)、进阶(VLM描述增强)、高级(Qwen3-VL黄金架构)和智能体阶段(Agentic RAG)。文章对比了CLIP双编码器、VLM描述生成和Qwen3-VL三大技术路径的

2026-05-05 23:14:45 480

原创 PDF图文混排企业实践:RAG的“最后一公里“

本文深入探讨了如何利用LlamaIndex框架解决图文混排PDF文档检索的难题。文章首先分析了企业数据现状,指出80%高价值信息被锁定在PDF中,并揭示了PDF格式的本质矛盾。随后详细阐述了四大技术挑战:布局语义丢失、多模态信息割裂、表格结构熵增和上下文碎片化。 技术方案部分提供了6步实战技术地图,对比了pypdf、PyMuPDF、LlamaParse和MinerU四种解析工具的优缺点。核心实现包括环境配置、成本优化策略和多模态索引架构设计,特别强调了企业级应用中如何平衡性能与成本。 文章最后通过三个实际案

2026-05-05 22:09:10 401

原创 实战指南:如何为你的AI应用选择最合适的Milvus索引

深入解析Milvus各种索引类型的区别、应用场景和关键参数调优,帮助您构建高性能的向量检索系统

2026-05-04 19:32:48 368

原创 DeepSeek_V4开源影响与应用小先锋

DeepSeek V4开源推动国产AI技术跃升 DeepSeek V4的发布标志着中国大模型技术进入全球第一梯队,其1.6T参数的V4-Pro版本和284B参数的V4-Flash版本分别针对高性能和性价比场景。关键技术突破包括百万级上下文支持、推理能力提升和工具调用优化,在代码、数学推理和中文处理方面已接近GPT-5水平。 该模型在金融、能源等领域快速落地:6家券商已部署用于智能投研和风控,处理效率提升300%;中石化炼油厂应用后故障排查效率提升50%。同时,国产芯片适配方案使推理成本降至1/10,带动昇腾

2026-05-03 16:09:58 408

原创 AI模型幻觉:行业上一些一本正经胡说八道的影响

AI模型幻觉已成为商业领域重大风险,2024年造成全球674亿美元损失。研究表明: 行业现状严峻:AI生成虚假信息比例一年内翻倍至35%,法律、医疗等专业领域幻觉率高达15-18%,且模型错误时使用自信词汇概率高出34% 技术表现差异:领先AI模型中,Google Gemini系列幻觉率最低(0.7-1.1%),而Claude-3.5达4.6%,任务复杂度每提升一级幻觉率增加3-5倍 成因分析:幻觉源于数据噪声(15%领域知识缺失)、模型架构缺陷(追求概率而非真实)及人类认知偏差(过度依赖AI输出) 解决方

2026-05-02 17:05:36 993

原创 2025年RAG检索方式行业最佳实践

2025年RAG检索技术最佳实践摘要 混合检索与重排序技术已成为企业级RAG系统的核心解决方案。行业数据显示,混合检索架构(向量+关键字+图谱)相比单一方法可减少35-60%错误率,NVIDIA、LinkedIn等企业实践证实其显著提升效果。LinkedIn集成知识图谱后MRR提升77.6%,工单处理时间缩短28.6%。重排序作为性价比最高的优化手段,通过多阶段处理(轻量级+交叉编码器+LLM)可实现10-20%的精度提升。典型实现包含自适应权重调整、结果智能融合等关键技术,Azure AI Search等

2026-05-01 15:27:35 632

原创 向量嵌入模型与文档切块检索真实避坑

构建高质量的RAG系统需要精心选择嵌入模型和优化文档切块策略。

2026-04-30 14:52:26 374

原创 传统与AI时代向量数据库对比

没有万能方案:不同场景需要不同的技术选型混合架构是趋势:单一数据库难以满足所有需求考虑迁移成本:现有系统的升级需要平衡成本和收益性能与功能平衡:在性能、功能、成本之间找到最佳平衡点。

2026-04-29 18:59:45 304

原创 向量数据库全面对比分析

向量数据库的选择需要综合考虑项目需求、技术团队能力和长期发展规划。没有绝对的最佳选择,只有最适合的选择。从实际需求出发,避免过度设计考虑团队技术栈和运维能力预留扩展空间,为未来发展考虑重视国产化趋势,关注国产方案通过本文的分析,希望能够帮助您在选择向量数据库时做出更明智的决策,为AI应用的成功落地奠定坚实基础。本文基于最新的向量数据库技术发展情况编写,技术细节可能随时间变化,建议在实际选型时参考官方文档和最新测试数据。

2026-04-28 22:30:41 646

原创 模型幻觉普及指南

AI模型幻觉:当人工智能"一本正经地胡说八道" 模型幻觉是指AI生成看似合理但实际错误或虚构的内容。这种现象主要表现为四种类型:事实性幻觉(编造不存在的事件)、逻辑幻觉(错误推理)、上下文幻觉(不合语境的内容)和自我矛盾幻觉(前后不一致的回答)。 产生幻觉的技术原因包括训练数据局限、概率生成机制和缺乏现实验证能力。用户可通过交叉验证、溯源检查等方式识别幻觉,重点关注过于具体的细节、缺乏来源或违背常识的内容。 应对策略包括:保持批判性思维、优化提问方式、设置合理预期。开发者则可通过改进提示

2026-04-27 09:19:50 385

原创 curl-wget-yum基础用法与区别对比

Linux常用工具对比摘要 本文对比了curl、wget和yum三大Linux工具的核心功能与用法: curl是强大的数据传输工具,支持多种协议,适合API交互和复杂请求,提供丰富的请求控制和输出选项。 wget专注于文件下载,支持递归下载和断点续传,适合批量下载和网站镜像。 yum是RHEL/CentOS的包管理器,自动处理依赖关系,提供软件安装、更新和仓库管理功能。 三者定位不同:curl侧重数据传输,wget专注文件下载,yum负责系统包管理。根据需求选择合适工具可显著提高工作效率。

2026-04-26 11:19:02 391

原创 基础的网络通信技术- WebSocket、SSE、双向长连接与HTTP握手挥手

大模型很好。

2026-04-25 23:59:36 503

原创 DeepSeek-V4-平民指南

DeepSeek-V4的发布,标志着AI真正进入了"平民化时代"。它不再是技术专家的专属玩具,而是每个人都能轻松使用的日常工具。现在就去试试吧!打开浏览器,输入chat.deepseek.com,开启你的AI新体验!本文基于2026年4月24日DeepSeek-V4预览版发布信息整理,内容会随版本更新而调整。官网:https://chat.deepseek.com技术报告:官网可下载社区讨论:各大技术论坛均有热烈讨论。

2026-04-24 23:34:48 1992

原创 网关-TCP-UDP技术详解

网关(Gateway):网络互联的关键设备,实现协议转换和网络扩展TCP协议:可靠的面向连接传输协议,保证数据完整性和顺序性UDP协议:高效的无连接传输协议,适合实时应用和广播通信。

2026-04-23 19:45:38 410

原创 Dify优势与劣势浅思

Dify作为低代码AI开发平台,显著降低技术门槛,支持可视化工作流编排和RAG引擎,适合快速原型开发和非技术团队使用。核心优势在于开发效率提升(周期缩短85%)和成本节约(人力节省50-100%),开源生态活跃。但存在明显局限:性能上单机并发超50用户即出现延迟,企业级功能缺失如RBAC权限管理,定制化深度不足无法满足复杂算法需求。推荐用于教育演示、MVP验证等轻量场景,而不适用于高并发生产系统或严格合规要求的企业环境。技术选型需权衡效率与功能深度需求。

2026-04-22 19:21:38 631

原创 Windows-Docker-Linux-Dify避坑指南

Windows Docker安装失败Linux服务器配置复杂端口冲突、权限问题、网络连接失败…经过无数次失败和调试,我终于总结出了这份避坑指南,让你少走弯路,一次成功!检查系统要求开启硬件虚拟化安装WSL2下载官方Docker安装包完成安装并验证检查服务器环境安装Docker和Docker Compose创建部署目录下载配置文件检查端口占用启动Dify服务验证部署成功。

2026-04-21 22:46:57 398

原创 传统方式AI想连Google Drive → 为什么要写一套接口

传统方式AI想连Google Drive → 为什么要写一套接口

2026-04-21 09:56:00 236

原创 大模型本地部署方案对比总结

本文对比分析了三种主流大模型本地部署方案(Ollama、vLLM、llama.cpp)的核心特点和适用场景。Ollama提供开箱即用的简易体验,适合个人开发者;vLLM专为高性能GPU环境设计,适用于企业级高并发场景;llama.cpp则以极致轻量化见长,能在边缘设备运行。选择指南建议根据用户类型(普通/企业/极客)和硬件条件(高性能GPU/普通PC/嵌入式设备)进行匹配,形成完整的本地部署生态解决方案。

2026-04-19 22:12:16 682

原创 3D Tiles Next和3D Tiles 1.0的区别

下一代3D tiles文件的亮点和新思路

2023-11-19 23:27:44 901

原创 基于工程量的智能动态计划管控

基于BIM算量的智能计划管理的项目总结

2022-05-02 23:24:13 247

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除