自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

许泽宇的技术分享

微软最有价值专家(Al Platform MVP),华为云开发者专家(HCDE),NebulaGraph认证专家,Neo4j认证专家,上市公司首席架构师,211研究生在读,专注.Net 和AI相关技术,内容涵盖教程、技巧、行业动态及解决方案

  • 博客(361)
  • 资源 (4)
  • 收藏
  • 关注

原创 揭秘MinerU:开源界最强PDF解析神器的技术内幕!从YOLO到VLM,看AI如何重新定义文档理解

MinerU:颠覆性PDF解析工具的技术突破 上海AI实验室开源的MinerU是新一代PDF解析工具,在GitHub获6万+星标。其创新性体现在: 技术架构 双引擎设计:结合传统CV与VLM视觉语言模型 支持文本/表格/公式/图片的多模态解析 84种语言识别能力 核心优势 端到端智能理解文档结构 单卡4090可达10,000+token/s处理速度 公式识别准确率>95%,表格结构完整率94% 应用价值 学术文献处理:批量解析科研论文 企业文档数字化:保持复杂版式结构 RAG系统预处理:输出结构化数据

2025-09-17 15:32:28 811

原创 多智能体编排之王:深度解析微软Semantic Kernel的AgentOrchestration架构革命

微软SemanticKernel的AgentOrchestration框架开创了多智能体协作新模式,通过四大编排机制(Sequential/Concurrent/GroupChat/Handoff)实现AI群体智慧。该框架基于Actor模型,提供类型安全转换管道和可观测性设计,支持.NET生态下的企业级应用开发。与LangGraph、AutoGen等方案相比,其在工程化和可扩展性方面表现突出,特别适合客服系统、内容创作、金融风控等复杂场景。该技术通过解耦编排逻辑与具体实现,为多智能体系统开发提供了标准化解决

2025-09-17 15:19:38 593

原创 AI时代的文档解析神器:MinerU技术架构深度剖析与实战解码

MinerU是一款革命性的开源AI文档处理工具,它通过创新的双引擎架构(Pipeline+VLM)实现了PDF文档的智能解析。该项目集成了YOLO布局检测、UniMERNet公式识别、多语言OCR等先进技术,能够高精度提取文档中的文本、表格、公式等内容,并保持原始结构。相比传统工具,MinerU在学术论文、企业文档等多场景展现出显著优势,支持84种语言处理,表格识别准确率达95%+。其模块化设计支持GPU加速,最低8GB显存即可运行,为文档数字化提供了高效解决方案。

2025-09-16 18:34:34 1182

原创 AnythingLLM:开源RAG系统的王者归来,揭秘私有化AI助手的技术密码

《开源RAG系统AnythingLLM深度解析》摘要:AnythingLLM是一款全栈开源RAG系统,支持将任意文档转化为AI可理解的知识库,具有私有化部署、多用户管理等特性。技术架构采用React+Vite前端和Node.js+Express后端,支持15种文件格式和10种向量数据库。核心优势包括:完整的产品化设计(对比LangChain框架)、完全开源(对比Dify的商业化限制)、企业级安全特性。应用场景涵盖企业知识库、医疗咨询、个人学习助手等。通过智能缓存、并发处理和内存优化实现高性能,支持Docke

2025-09-16 15:09:17 702

原创 APIPark:重新定义AI时代的API网关 —— 从100+模型统一接入到企业级应用

APIPark:开源AI网关的技术革新 APIPark是一个开源AI网关和API开发者门户,旨在统一管理100+AI模型,简化复杂API调用。基于团队七年API开发经验,它支持动态模块加载、多模型智能路由和本地AI集成(如Ollama),提供完整的API生命周期管理。技术亮点包括: 统一抽象设计:通过标准化接口兼容各类AI模型(如GPT-4、Gemini)。 微服务架构:Go语言后端+React前端,支持容器化一键部署。 MCP协议:实现AI模型上下文管理,自动化OpenAPI转换。 性能优化:异步处理、智

2025-09-15 18:05:46 634

原创 企业架构中的智能引擎——告别“各自为政“的大模型集成困局

企业数字化转型面临AI模型分散集成的挑战,传统方式导致重复建设、成本失控、安全风险等问题。聚合API通过统一接口、智能路由、集中监控等十大核心优势,实现AI服务的高效整合。它能降低60%开发成本、提升5倍响应速度,支持动态配额分配和智能缓存,同时保障企业级安全和合规。实施路径包括评估规划、基础设施搭建、试点项目验证和全面推广四个阶段,通常6-12个月可完成转型。典型案例显示,聚合API可使企业AI年度支出降低51.8%,开发周期缩短75%。未来,该技术将向自适应路由、边缘计算和量子集成方向发展,成为企业AI

2025-09-15 18:01:30 751

原创 AISE软件工程提效革命:从“代码为王“到“规范驱动“的开发范式转变

在软件工程的演进历程中,我们见证了无数次技术革命,从面向过程到面向对象,从瀑布模型到敏捷开发,每一次转变都重新定义着我们构建软件的方式。而今天,随着AI技术的突破性进展,一场更为深刻的变革正在悄然发生——规范驱动开发(Spec-Driven Development, SDD)正在挑战"代码为王"的传统思维,预示着软件工程即将迎来新的黄金时代。规范就是蛋,代码就是孵化的过程。这不仅仅是一种新的工作流程,更是对软件开发本质的重新审视。

2025-09-14 23:59:30 889

原创 New API:新一代AI大模型网关的技术革命与实践解析

摘要: NewAPI是基于Go语言开发的新一代AI大模型网关与资产管理系统,作为OneAPI的优化版本,支持接入GPT-4、Claude、文心一言等20+种AI模型,提供统一API接口和智能路由。其技术亮点包括: 架构设计:前后端分离(Gin+React),微服务化,支持SQLite/MySQL/PostgreSQL和Redis缓存; 核心功能:多模型适配器、负载均衡算法、多Key轮询、精确Token计费及WebSocket实时通信; 性能优化:内存缓存、故障自动切换、异步处理,并发处理能力达1000+请求

2025-09-14 23:53:07 1070

原创 AI时代的内容创作革命:深度解析xiaohongshu-mcp项目的技术创新与实战价值

项目不仅仅是一个技术工具,更是一个思维方式的体现。它告诉我们,在AI时代,技术的价值不在于复杂性,而在于能否真正解决实际问题,能否为用户创造价值。

2025-09-13 22:49:07 1149

原创 当AI遇上数据库:Text2Sql.Net如何让“说人话查数据“成为现实

Text2Sql.Net:AI驱动的自然语言数据库查询工具 Text2Sql.Net是一款创新的AI工具,它通过自然语言处理技术将用户输入的自然语言查询转换为可执行的SQL语句。该工具采用Blazor+AntDesign前端框架和.NET8后端架构,集成Microsoft Semantic Kernel和OpenAI GPT等AI技术,实现了智能的表结构分析、向量语义搜索和多轮对话理解等核心功能。相比传统Text2SQL工具,其主要优势包括:支持MySQL、SQLServer等多数据库适配;通过MCP协议实

2025-09-13 22:12:52 1035

原创 腾讯CodeBuddy CLI深度解析:命令行AI编程的革命性突破,99%编程工作或将重新定义!

《自然语言编程时代来临:腾讯CodeBuddyCLI引领开发范式革命》 文章摘要: 腾讯CodeBuddyCLI的发布标志着编程范式正经历根本性变革。这款命令行工具通过自然语言交互实现代码生成,其核心创新在于:1)极简安装与微信生态整合,2)双模型智能调度机制(国内/国际大模型),3)项目上下文智能理解能力。工具支持从UI截图到代码转换的多模态交互,并能自动完成代码审查、测试生成等全流程开发任务。典型案例显示,开发者只需1%的精力描述需求,AI即可完成99%的编码工作。这种转变将开发者角色从代码编写者升级为

2025-09-12 16:59:29 857 1

原创 从“插件化“到“智能化“:解密Semantic Kernel中Microsoft Graph的架构设计艺术

摘要: Microsoft Semantic Kernel框架中的Microsoft Graph插件展现了AI时代企业级应用的设计哲学。该插件通过分层架构(插件层、连接器层、模型层、SDK层)实现语义化接口,将Graph API转化为AI可理解的智能操作,支持邮件、日程、任务等企业协作场景。其核心创新在于从“命令式调用”转向“意图驱动协作”,通过异步设计、错误语义化转换及标准化数据模型,使AI能自主完成复杂工作流(如智能会议安排、文档协作)。设计上采用适配器模式隔离技术细节,工厂模式构建插件生态,并严格遵循

2025-09-12 14:55:46 916

原创 微软图引擎GraphEngine深度解析:分布式内存计算的技术革命

微软GraphEngine:内存中的图计算革命 GraphEngine(Trinity)是微软推出的高性能分布式图计算引擎,通过创新的内存云架构和TSL类型语言,解决了传统数据库处理复杂关系数据的性能瓶颈。其核心包括: 分层架构:从内存云层到计算引擎层,实现高效的数据访问与分布式计算; MemoryCloud:全局内存寻址与无锁并行设计,支持微秒级延迟; TSL语言:类型安全的数据建模与自动代码生成,优化内存布局; LIKQ查询引擎:集成Lambda表达式,实现分布式图遍历与实时分析。 在社交网络、知识图谱

2025-09-12 12:44:31 1160

原创 Semantic Kernel Planners 深度解析:智能任务编排的新纪元

SemanticKernel Planners:AI任务编排的革命性突破 SemanticKernel Planners将AI从被动问答升级为主动规划者,实现从目标到执行的智能转化。核心突破包括: 智能函数编排:通过AutoFunctionCalling自动选择最优执行路径,减少90%的Token消耗,支持并行与串行策略。 状态化流程引擎:ProcessFramework支持复杂业务逻辑的持久化执行,如订单处理、危机管理等多步骤工作流。 多智能体协作:Agent Orchestration实现专业化AI团队

2025-09-11 10:24:12 832

原创 Semantic Kernel Plugin 深度解析:构建智能应用的扩展艺术

摘要: SemanticKernelPlugin架构通过模块化设计(如乐高积木)赋能AI应用开发,将功能封装为可组合的Plugin,支持API调用、文档处理等场景。其核心特性包括:1. 层次化设计(Kernel-Plugin-Function),确保职责分离;2. 元数据驱动,通过函数描述和参数注解增强AI理解;3. 类型安全,减少运行时错误。实践案例覆盖智能客服、文档处理等领域,强调SOLID原则、错误处理及性能优化(如异步/流式处理)。高级特性支持动态加载、权限控制与健康监控,未来或将实现AI驱动的Pl

2025-09-11 09:47:12 1120 1

原创 LangGraph中ReAct模式的深度解析:推理与行动的完美融合——从理论到实践的智能Agent构建指南

本文深入探讨了ReAct(Reasoning and Acting)模式及其在LangGraph中的实现,揭示了这一人工智能领域的重大突破。文章首先阐述了ReAct模式的核心思想:将推理与行动循环结合,模拟人类"思考-行动-观察"的认知过程,从而克服传统AI系统的封闭性局限。随后详细解析了LangGraph中ReAct模式的架构设计,包括Agent节点、工具节点和条件路由三大核心组件,以及精巧的状态管理机制。文章通过多个实战案例(如智能客服、数据分析助手、代码审查工具)展示了ReAct模

2025-09-10 11:30:35 765

原创 LangGraph深度解析:构建下一代智能Agent的架构革命——从Pregel到现代AI工作流的技术飞跃

本文深入探讨LangGraph框架如何革新智能Agent开发,揭示其核心算法与架构优势。文章从Pregel分布式计算模型的分析入手,阐释LangGraph如何通过状态图、检查点系统等创新设计实现智能Agent的复杂逻辑编排。通过对比CrewAI、AutoGen等主流框架,突出LangGraph在状态管理、持久化恢复等方面的技术突破。三个实战案例(智能客服、代码审查、多模态生成)展示了框架的实际应用价值。文章还探讨了性能优化技巧及未来发展趋势,指出LangGraph通过模块化设计和声明式编程范式,正在推动智能

2025-09-10 10:47:10 899

原创 语义革命:AntSK-FileChunk让RAG系统告别粗暴切片时代

在AI如火如荼发展的今天,RAG(检索增强生成)系统已经成为大语言模型的"黄金搭档",但你知道吗?大部分RAG系统的文本切片方式还停留在"石器时代"——简单粗暴的固定长度切分。想象一下,这就像用菜刀切牛排,完全不考虑肉的纹理!今天,我们要介绍一个真正理解文本"语义纹理"的切片神器——。这个项目不仅颠覆了传统切片思维,更是将文档处理推向了新高度,支持图片、表格的智能处理,堪称RAG系统的"语义外科手术刀"。从技术角度:语义感知:真正理解文本含义,而非简单的字符操作多模态支持:完整处理现代文档的复杂内容。

2025-09-09 17:19:00 1129

原创 揭秘OpenManus:三小时打造的智能Agent框架,开发者的“万能助手“究竟如何炼成?

MetaGPT团队仅用3小时开发出功能完备的AI智能体框架OpenManus,展现了极速开发的突破。该框架采用模块化设计(智能体+工作流+工具集),具有三大核心优势:1)清晰的状态管理和安全机制;2)灵活可扩展的工具系统;3)优雅的异步编程实现。它不仅支持单智能体运行,还能构建多智能体协作流程,已成功应用于旅行规划、代码生成等场景。这一成果验证了"AI+敏捷开发"的可行性,为智能体开发提供了新范式,同时启示开发者应更关注架构设计和需求定义等核心价值。

2025-09-08 17:45:38 1070

原创 重新定义音频编程:SoundFlow如何以模块化设计革新.NET音频开发生态

《SoundFlow:重构.NET音频开发的优雅艺术》摘要 SoundFlow是一款革命性的跨平台.NET音频引擎,将复杂的音频处理转化为优雅的组件化架构。其核心设计采用三层结构:引擎层负责设备管理、设备层处理独立音频流、组件层通过DAG网络实现模块化连接。系统通过SIMD指令优化和内存池化技术实现高性能实时处理,支持参数均衡器、混响等专业效果。创新的非线性编辑功能支持WSOLA时间拉伸,而WebRTC APM集成则提供企业级降噪能力。SoundFlow的跨平台抽象层和线程安全设计,使其适用于游戏开发、实时

2025-09-08 14:43:19 1036

原创 Text2Sql.Net架构深度解析:从自然语言到SQL的智能转换之道

AI时代的数据管理革命:Text2Sql.Net让数据库"听懂人话" Text2Sql.Net是基于.NET生态的自然语言转SQL智能工具,通过多层架构实现人机对话式数据库查询。核心技术包括:多轮对话处理(智能上下文管理)、Semantic Schema Linking(精准表结构匹配)、示例学习优化(自我进化机制)。创新性地集成了Microsoft Semantic Kernel、向量搜索和MCP协议,支持Blazor前端可视化。 典型应用场景:数据分析师无需编写复杂SQL,业务人员直

2025-09-07 19:44:33 860

原创 告别提示词地狱:Parlant革命性AI代理框架深度剖析,让你的AI真正听话!

【摘要】Parlant框架为解决AI代理"不听话"问题提供了创新方案。传统AI开发依赖冗长的提示词工程,存在维护困难、输出不可控等痛点。Parlant通过行为建模引擎(ABM)实现四大创新:1)模块化的Guidelines指导原则系统;2)灵活的Journeys对话旅程;3)安全绑定的Tools工具调用;4)消除幻觉的CannedResponses预置响应。该框架采用动态上下文管理和ARQ推理技术,特别适合金融、医疗等对合规性要求高的场景。案例分析显示,医疗咨询AI通过Parlant实现

2025-09-07 19:30:38 1023

原创 从零到一构建企业级AI向量服务:AntSK-PyApi深度技术解析

本文介绍了开源企业级向量服务项目AntSK-PyApi,该项目基于Python构建高性能文本嵌入向量生成与文档重排序API服务。文章分析了项目技术架构,包括FastAPI异步框架、智能模型管理系统和OpenAI兼容API设计,重点解读了核心功能实现、性能优化策略和企业级特性。该项目解决了模型管理复杂、性能优化困难等痛点,支持RAG系统、语义搜索等AI应用场景。文章还探讨了未来技术演进方向,如多模态支持、分布式部署等,并分享了开发调试与部署最佳实践。该项目展示了如何构建高质量的AI基础设施,为开发者提供了有价

2025-09-06 19:38:30 860

原创 语义切片技术深度解析:重新定义RAG时代的文本处理范式

《语义切片技术:RAG系统的文本处理革命》 摘要:AntSK-FileChunk项目开创性地将语义理解引入文本切片领域,通过四大核心组件构建智能处理架构:DocumentParser实现多格式统一解析,SemanticAnalyzer完成深度语义分析,EnhancedSemanticChunker执行智能边界检测,ChunkOptimizer进行质量优化。相比传统方法,该技术使语义连贯性提升50%,边界质量提高91%,在电商客服、法律文书等场景中显著提升检索准确率(29%)和用户满意度(44%)。项目创新性

2025-09-06 19:28:22 1108

原创 AI软件工程提效革命:GitHub MCP服务器解码AI与代码协同的新纪元

GitHub开源的MCP(ModelContextProtocol)服务器项目正在颠覆AI与软件工程的协作方式。该项目通过标准化接口让AI深度理解代码上下文,构建了包含15个模块化工具集的智能系统,支持代码审查、项目管理和智能运维等场景。关键技术亮点包括动态工具发现机制、多协议智能适配和分层安全模型,实现了从代码生成到架构设计的全流程AI辅助。文章指出这标志着从"AI工具"向"AI协作者"的范式转变,建议开发者通过渐进式策略拥抱这一变革,同时强调需平衡效率提升与技术掌

2025-09-05 23:08:19 892

原创 AISE软件工程提效革命:从“代码为王“到“规范驱动“的开发范式转变

文章摘要: 《规范驱动开发(SDD):AI时代软件工程的范式革新》探讨了传统“代码为王”开发模式的困境(需求漂移、文档失效、技术债务),并提出以AI为核心的SDD新范式——将可执行规范作为系统“DNA”,自动生成高质量代码。通过开源项目SpecKit的实践分析,文章展示了SDD如何通过分层架构、宪法约束和语义化分支管理,实现96.9%的效率提升与100%文档一致性。未来,SDD将推动行业规范标准化、教育体系重构和开发角色转型,其技术栈无关性更可能重塑企业数字化转型路径。文章呼吁开发者拥抱这场从“如何实现”转

2025-09-05 23:03:21 834

原创 开发者的效率神器:CCPlugins让AI编程助手如虎添翼

《CCPlugins:AI赋能的智能开发助手》摘要 CCPlugins是一套专为ClaudeCodeCLI设计的24个专业命令集合,通过结构化AI指令解决开发者日常痛点。该系统采用"安全第一"设计理念,自动创建git检查点,确保代码安全。技术架构上,CCPlugins结合智能指令系统和原生工具集成,提供框架无关、多语言支持的通用兼容性。核心功能包括开发工作流优化(如智能清理项目、自动生成提交信息)、代码质量审查(多代理分析、安全漏洞扫描)和高级架构分析。实际应用中,CCPlugins每周

2025-09-04 17:36:30 1814 1

原创 SQL优化与准确性提升:基于RAG框架的智能SQL生成技术解析

摘要: Vanna开源项目通过检索增强生成(RAG)框架显著提升自然语言转SQL的准确性(从3%跃升至80%)。其核心创新在于动态检索数据库模式、文档及相似SQL示例作为上下文,结合灵活可扩展的架构(支持多种LLM/向量数据库),解决了传统AI方法缺乏领域知识、安全隐患等问题。Vanna实现了业务用户自主查询数据、分析师聚焦高阶分析的流程变革,并通过本地执行、权限控制确保安全性。研究表明,提供精准上下文比单纯依赖大模型性能更关键,为专业领域AI应用提供了范式参考。未来将向复杂数据库支持、自动SQL优化等方向

2025-09-04 10:44:24 715

原创 Semantic Kernel Agent:微软打造的AI智能体开发“神器“——从零到一玩转企业级AI助手

微软SemanticKernelAgent:企业级AI应用落地的关键技术 摘要:SemanticKernelAgent是微软推出的AI大模型应用框架,它将语言模型从"能聊天"升级为"能做事"。该框架通过统一抽象层设计支持多种AI模型,提供流式响应、函数调用、RAG能力和多Agent协作等核心功能。其插件化架构和简洁API使开发效率提升60%,同时具备企业级安全控制和状态持久化特性。相比传统ChatGPT API,在开发时间、代码复杂度、响应时间和准确率等关键指标上均有

2025-09-03 11:40:42 827

原创 Semantic Kernel AgentGroupChat 多Agent发言控制机制详解

AgentGroupChat是SemanticKernel中管理多Agent对话的核心组件,提供灵活的发言控制和终止机制。核心包括AgentGroupChat类(管理Agent列表和执行设置)和AgentGroupChatSettings(配置选择/终止策略)。选择策略支持顺序选择(SequentialSelectionStrategy)或基于AI函数的智能选择(KernelFunctionSelectionStrategy)。终止策略可通过关键词或函数判断对话完成。支持自动或手动指定Agent发言,并控制

2025-09-03 09:26:50 771

原创 Semantic Kernel 多Agent使用指南

本文介绍了SemanticKernelAgentFramework多agent系统的核心功能与使用方法。该系统支持创建具有特定角色和能力的智能代理,包括ChatCompletionAgent和OpenAIAssistantAgent两种类型,可通过AgentGroupChat实现代理协作。文档详细说明了终止策略、选择策略等核心组件,并提供了基础协作、混合代理、复杂嵌套等多种应用场景示例。此外,还介绍了高级功能如代码解释器、文件检索、代理即插件模式等,以及密钥配置、性能优化等最佳实践。该框架为构建复杂智能协作

2025-09-03 09:17:39 1095

原创 DataAgent技术解析:数据智能的未来之路

DataAgent技术正在重塑数据分析领域,通过自然语言交互实现数据民主化。本文深入探讨了DataAgent的核心价值、技术路径和未来趋势。DataAgent将大语言模型与数据工程相结合,提供Text-to-SQL、Text-to-Code和Text-to-API三种实现方式,显著降低分析门槛。典型架构包含交互层、智能层、工具层和数据层,核心组件包括多模型管理框架和RAG框架。应用场景涵盖企业决策、数据治理和智能客服等领域。尽管面临准确性、安全性和业务集成等挑战,但随着多模态融合和自主学习等技术的发展,Da

2025-09-02 16:52:52 1061

原创 Text2SQL与DataAgent技术深度对比与实践指南

本文深入探讨了Text2SQL与DataAgent两大技术路线在企业数据智能化转型中的比较与应用。Text2SQL专注于自然语言转SQL查询,技术成熟但准确率有限(约80%);DataAgent则提供从数据获取到可视化的完整分析流程,复杂度更高但业务价值更大。文章从技术原理、实现路径、性能对比到应用案例进行全面分析,指出Text2SQL适合技术用户和简单查询,DataAgent更适合非技术用户和复杂分析。未来趋势将向多模态支持、混合架构方向发展。企业选型需综合考虑用户需求、技术成熟度和资源投入,可采用混合策

2025-09-02 16:33:42 1064

原创 突破传统文本切片的瓶颈:AntSK-FileChunk语义切片技术详解前言

本文介绍了AntSK-FileChunk语义切片技术,该技术通过深度学习模型分析文本语义,智能分割长文档,解决了传统固定长度和分隔符切片方法导致的语义割裂问题。系统核心组件包括文档解析器、语义分析器、切片优化器和质量评估器,采用语义连贯性计算和自适应长度控制等算法,显著提升了检索增强生成(RAG)等下游任务的效果。实验显示,语义切片在检索准确率和答案完整性上比传统方法提升20%以上。未来将扩展多模态支持、领域特定优化和分布式处理等功能。该技术为AI系统处理长文本提供了更高效的解决方案。

2025-09-01 11:16:15 791

原创 RAG召回准确性提升技巧:从向量检索到混合搜索的技术革命

摘要:本文系统探讨了提升RAG(检索增强生成)召回准确性的技术方案。针对传统向量检索存在的命中率低、语义鸿沟等问题,提出从基础优化到高级策略的完整解决方案。基础优化包括分词器改进、向量模型选择和数据结构优化;高级技术涵盖意图识别、HyDE假设生成、混合检索及重排序等方法。实测数据显示,优化措施可使召回率提升15-20%,Top1准确率提升达31%。文章还展望了多模态RAG、知识图谱增强等未来发展方向,为构建高性能RAG系统提供了实用技术路线。

2025-09-01 10:36:09 840

原创 炸裂更新!Playwright MCP终于能用你的Chrome登录态了,AI自动化彻底起飞!

【摘要】微软推出的PlaywrightMCP浏览器自动化协议迎来重大更新,支持直接控制用户现有Chrome浏览器,继承登录状态、书签等数据。该技术突破解决了AI自动化长期存在的"新开浏览器"痛点,使AI能像"数字分身"一样操作网页。文章详细介绍了安装指南、两个实战案例(项目测试和小红书购物助手),并对比分析了PlaywrightMCP的技术优势。未来,这项技术将推动办公自动化、市场调研等场景的质变,标志着AI自动化进入"无缝衔接"新时代。

2025-08-31 11:58:51 1323

原创 RAG切片优化深度解析:从文档分块到智能检索的技术革命

RAG切片技术:连接大模型与知识库的关键桥梁 在AI技术快速发展的今天,RAG(检索增强生成)系统的切片技术已成为提升大模型性能的关键因素。本文深入探讨了RAG切片技术的演进历程、核心策略和未来趋势。 技术演进: 固定切片的"暴力美学"时代 语义感知的智能分割阶段 自适应动态切片的当前发展 核心策略分析: 固定大小切片:简单高效但语义完整性不足 语义切片:保持上下文关联但计算成本高 递归切片:兼顾结构与效率的平衡方案 多向量索引:提升检索召回率的创新方法 未来展望: 自适应学习:根据用户

2025-08-31 10:58:51 922

原创 别再让 AI “裸奔”了:Playwright MCP 接入 Chrome 登录态,浏览器自动化的临界点已到

AI浏览器自动化迈入"带身份工作"新阶段:Playwright MCP通过继承用户Chrome登录态、书签和浏览习惯,显著提升自动化效率与"人机协作"体验。该技术突破传统隔离环境限制,让AI像"老员工"一样直接使用现有工作环境,同时保持权限管控和操作审计。典型应用场景包括企业内网操作、跨平台比价和自动化测试等,通过"最小权限+最大上下文"原则,在安全性和实用性间取得平衡。最佳实践建议采用分层选择器策略、智能等待机制和操作留痕,逐

2025-08-30 22:45:11 1008

原创 别急着上多Agent:单Agent vs 多Agent,一文读懂架构、边界与落地取舍

【摘要】本文系统探讨了单Agent与多Agent系统的技术路线与选型策略。单Agent适合处理70%的中轻量任务,具备维护简单、成本低的优势;而多Agent则在跨域协作、并行处理和质量审校等场景展现价值。文章从工程落地角度,对比了两者在延迟、成本、可靠性等维度的差异,并提供了LlamaIndex和AutoGen的代码示例。关键设计点包括角色分工、工具协议、消息传递和记忆管理。作者建议采用"三步走"策略:先优化单Agent,再针对性引入多Agent分工,最后用LangGraph等工具实现工

2025-08-30 22:41:08 987

原创 AntSK知识库多格式导入技术深度解析:从文档到智能,一站式知识管理的技术奇迹

AntSK知识库系统多格式导入技术解析 AntSK知识库系统通过创新的多格式导入技术,实现了对多样化知识源的高效整合。系统采用"统一接口+差异化处理"架构,支持文本、文件、URL、音频、Excel和媒体等多种格式的智能导入,每种类型都有专属处理逻辑。 核心技术亮点包括: 智能预处理机制,支持文档转换、结构切分和内容预览 多模态处理能力,集成OCR和语音识别技术 异步处理架构,确保高性能和可扩展性 插件化设计,便于功能扩展 系统采用Blazor框架实现前后端统一开发,结合AntDesign

2025-08-29 23:54:37 970

AntSK0.6.5 一件部署包,可以快速实现本地RAG知识库

AntSK功能介绍 基于.Net9+AntBlazor+SemanticKernel 打造的AI知识库/智能体 核心功能 语义内核 (Semantic Kernel):采用领先的自然语言处理技术,准确理解、处理和响应复杂的语义查询,为用户提供精确的信息检索和推荐服务。 内存内核 (Kernel Memory):具备持续学习和存储知识点的能力,AntSK 拥有长期记忆功能,累积经验,提供更个性化的交互体验。 知识库:通过文档(Word、PDF、Excel、Txt、Markdown、Json、PPT)等形式导入知识库,可以进行知识库问答。 GPTs 生成:此平台支持创建个性化的GPT模型,尝试构建您自己的GPT模型。 API接口发布:将内部功能以API的形式对外提供,便于开发者将AntSK 集成进其他应用,增强应用智慧。 API插件系统:开放式API插件系统,允许第三方开发者或服务商轻松将其服务集成到AntSK,不断增强应用功能。 .Net插件系统:开放式dll插件系统,允许第三方开发者或服务商轻松将其业务功能通过标准格式的代码生成dll后集成到AntSK,不断增强应用功能。

2025-06-22

AntSK0.6.2 一件部署包,可以快速实现本地RAG知识库

AntSK功能介绍 基于.Net8+AntBlazor+SemanticKernel 打造的AI知识库/智能体 核心功能 语义内核 (Semantic Kernel):采用领先的自然语言处理技术,准确理解、处理和响应复杂的语义查询,为用户提供精确的信息检索和推荐服务。 内存内核 (Kernel Memory):具备持续学习和存储知识点的能力,AntSK 拥有长期记忆功能,累积经验,提供更个性化的交互体验。 知识库:通过文档(Word、PDF、Excel、Txt、Markdown、Json、PPT)等形式导入知识库,可以进行知识库问答。 GPTs 生成:此平台支持创建个性化的GPT模型,尝试构建您自己的GPT模型。 API接口发布:将内部功能以API的形式对外提供,便于开发者将AntSK 集成进其他应用,增强应用智慧。 API插件系统:开放式API插件系统,允许第三方开发者或服务商轻松将其服务集成到AntSK,不断增强应用功能。 .Net插件系统:开放式dll插件系统,允许第三方开发者或服务商轻松将其业务功能通过标准格式的代码生成dll后集成到AntSK,不断增强应用功能。

2025-03-04

AntSK免安装部署版(需要.net 8 SDK环境)

AntSK是一个可以运行本地/在线大模型的 AI知识库项目

2025-01-13

AntSK0.5.1 一件部署包,可以快速实现本地RAG知识库

AntSK功能介绍 基于.Net8+AntBlazor+SemanticKernel 打造的AI知识库/智能体 核心功能 语义内核 (Semantic Kernel):采用领先的自然语言处理技术,准确理解、处理和响应复杂的语义查询,为用户提供精确的信息检索和推荐服务。 内存内核 (Kernel Memory):具备持续学习和存储知识点的能力,AntSK 拥有长期记忆功能,累积经验,提供更个性化的交互体验。 知识库:通过文档(Word、PDF、Excel、Txt、Markdown、Json、PPT)等形式导入知识库,可以进行知识库问答。 GPTs 生成:此平台支持创建个性化的GPT模型,尝试构建您自己的GPT模型。 API接口发布:将内部功能以API的形式对外提供,便于开发者将AntSK 集成进其他应用,增强应用智慧。 API插件系统:开放式API插件系统,允许第三方开发者或服务商轻松将其服务集成到AntSK,不断增强应用功能。 .Net插件系统:开放式dll插件系统,允许第三方开发者或服务商轻松将其业务功能通过标准格式的代码生成dll后集成到AntSK,不断增强应用功能。

2024-09-30

AntSK0.5.0 一件部署包,可以快速实现本地RAG知识库

AntSK功能介绍 基于.Net8+AntBlazor+SemanticKernel 打造的AI知识库/智能体 核心功能 语义内核 (Semantic Kernel):采用领先的自然语言处理技术,准确理解、处理和响应复杂的语义查询,为用户提供精确的信息检索和推荐服务。 内存内核 (Kernel Memory):具备持续学习和存储知识点的能力,AntSK 拥有长期记忆功能,累积经验,提供更个性化的交互体验。 知识库:通过文档(Word、PDF、Excel、Txt、Markdown、Json、PPT)等形式导入知识库,可以进行知识库问答。 GPTs 生成:此平台支持创建个性化的GPT模型,尝试构建您自己的GPT模型。 API接口发布:将内部功能以API的形式对外提供,便于开发者将AntSK 集成进其他应用,增强应用智慧。 API插件系统:开放式API插件系统,允许第三方开发者或服务商轻松将其服务集成到AntSK,不断增强应用功能。 .Net插件系统:开放式dll插件系统,允许第三方开发者或服务商轻松将其业务功能通过标准格式的代码生成dll后集成到AntSK,不断增强应用功能。

2024-08-22

Deep Learning Tutorial

人工智能学习文档 Deep Learning Tutorial 适合新手学习

2017-12-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除