- 博客(39)
- 资源 (15)
- 问答 (1)
- 收藏
- 关注
原创 LlamaIndex 文档解析与分块策略深度解析
本文剖析了LlamaIndex在RAG系统中的文档解析与分块技术架构。文章首先指出分块策略是影响检索质量的关键因素,随后详细介绍了LlamaIndex的核心设计: 数据模型采用Document→Node转换管线,通过NodeRelationship维护节点间关系,支持层级分块等高级特性 文档加载通过SimpleDirectoryReader实现多格式文件批量读取,并自动过滤干扰性元数据 分块策略体系包含四大类: 文本分块(基于规则) 语义分块(基于相似度) 结构化分块(按文档格式) 层级分块(维护节点关系)
2026-06-08 21:19:51
196
原创 LlamaIndex索引类型全解析:原理与实战指南
本文深入解析了LlamaIndex的14种索引类型,重点介绍了最常用的VectorStoreIndex、SummaryIndex、TreeIndex和KeywordTableIndex四种索引。VectorStoreIndex基于向量相似度检索,适用于90%的RAG场景;SummaryIndex通过遍历所有内容实现简单汇总;TreeIndex采用分层摘要树结构,适合大规模文档;KeywordTableIndex利用关键词倒排映射实现高效检索。文章从构建原理、检索策略、内部组件、特点对比和适用场景等方面进行了
2026-06-08 17:14:12
461
原创 Python 大厂面试题库 100 道 · 职场开发必备
高频考点闭眼都要过一遍——可变与不可变对象区别、装饰器写法、生成器与迭代器原理、GIL是什么、深拷贝浅拷贝、*args/**kwargs、闭包。数据结构上,列表字典的底层实现、哈希冲突解决,基本必问。算法至少刷到LeetCode中等,重点是双指针、滑动窗口、二叉树遍历。
2026-06-07 08:49:15
339
原创 RAGFlow 从入门到精通:完整学习教程
RAGFlow是一款开源的企业级RAG(检索增强生成)引擎,通过结合检索和生成技术解决大语言模型的固有局限。其核心优势包括深度文档理解能力、智能分块模板、可追溯引用、可视化Agent工作流编排等。RAGFlow支持混合检索策略和广泛的模型兼容性,相比竞品在文档解析精度和易用性上更胜一筹。系统架构涵盖数据接入、文档解析、知识处理和应用层,提供从文档处理到智能问答的全链路解决方案,尤其适合需要高准确性、可追溯性的企业场景。
2026-06-05 09:50:38
442
原创 AutoGen:微软开源的多Agent对话框架详解
AutoGen是微软开源的多Agent对话框架,支持多个LLM智能体通过对话协作完成复杂任务。核心特点包括: 核心架构:基于Agent(智能体)、Conversation(对话)、Tool(工具)等组件构建,支持代码执行、工具调用和人类参与。 核心优势: 企业级支持(微软生态) 灵活的Agent类型(如UserProxyAgent/AssistantAgent) 支持人类反馈和代码沙箱 活跃开发者社区(GitHub 45k+ Stars) 快速上手: 通过pip安装pyautogen包 配置LLM(如Ope
2026-06-05 09:30:25
472
原创 2026 年 - AI 开发者必备:Agent 开源生态图谱
2026年AI开源项目全景概览 GitHub最新数据显示,AI领域呈现爆发式增长,Agent框架成为最热门赛道,AutoGPT以18.4万星位居榜首。个人AI助手OpenClaw以37.5万星成为现象级项目,RAG、推理部署等工具也蓬勃发展。Python仍是主导语言,微软、阿里等企业及开源社区贡献显著。技术趋势显示:多Agent协作、轻量化部署、结构化输出成为关键方向,AI正加速渗透编程、图像生成等各领域。
2026-05-27 15:59:17
562
原创 2026年AI Agent技术生态开源项目合集
本文梳理了2026年AI Agent技术生态的八大核心领域及主流开源项目。核心框架方面,LangGraph、AutoGen等提供全流程编排能力;多智能体协作框架如CrewAI、MetaGPT支持角色分工与协同;工具调用与编排模块包含LangChain Tools、ToolFormer等工具集成方案;记忆系统部分涵盖LlamaIndex、Milvus等向量数据库技术。此外还介绍了低代码平台Dify、RAGFlow等可视化开发工具,以及专业领域Agent、评估监控、安全沙箱等关键技术组件,为AI Agent的选
2026-05-26 11:53:53
795
原创 Milvus向量数据库学习手册
Milvus是一款高性能开源向量数据库,专为相似性搜索设计,支持十亿级向量的毫秒级检索。其2.x版本采用分布式架构,包含接入层、协调服务层、工作节点层和存储层,支持多语言SDK和多种索引类型。Milvus 2.3-2.4版本新增GPU加速、稀疏向量支持、混合检索等特性。数据模型包含Collection、Partition、Field等核心概念,支持多种向量和标量数据类型。学习路线分为基础概念、性能调优和架构设计三个阶段,适合从入门到高级的开发需求。
2026-05-26 11:35:03
435
原创 Chroma向量库面试学习指南
Chroma向量数据库面试速查指南 核心要点 核心概念:Collection容器、WAL日志机制、HNSW分层图索引、距离度量方法 API操作:集合CRUD、数据增删改查(注意upsert用法)、相似度查询语法 性能优化:批量写入、先过滤后搜索、合理设置n_results参数 常见坑点:必须手动传ID、生产环境部署模式选择、索引碎片处理 适用场景 适用于语义搜索、RAG系统开发,特别适合中小规模AI应用的原型开发和生产部署。 (字数:149字)
2026-05-26 11:13:36
402
原创 2026最新RAG面试题集:45问覆盖全链路
RAG(检索增强生成)技术通过结合外部知识检索与大模型生成能力,显著提升了问答系统的准确性和时效性。其核心流程包括文档索引(数据清洗、文本切分、向量化存储)和查询处理(检索、重排序、生成)。相比微调,RAG具有知识更新快、成本低、可解释性强等优势,尤其适合知识频繁更新的场景。RAG架构经历了从基础版到模块化的演进,数据质量是影响效果的关键因素。与搜索引擎相比,RAG更擅长生成精准答案而非返回文档列表。处理复杂文档格式时需采用针对性解析策略,如PDF使用PyMuPDF,表格结合OCR与布局分析等。实际应用中,
2026-05-25 19:34:29
467
原创 万字拆解:从“伪AI项目”到工业级RAG,如何用“三板斧”彻底解决语义丢失,征服大厂面试官
本文揭示了工业级RAG项目中的三大核心痛点:文档结构丢失、上下文割裂和检索性能低下。针对这些问题,作者提出了全链路技术解决方案"三板斧":1)通过多模态解析和元数据绑定实现源头结构还原;2)采用中文优化递归切分、HanLP语义分析和父子块关联的三层递进式语义分割;3)构建分层关联与混合检索的增强体系。该方案从数据预处理到最终检索形成闭环,既保障语义完整性,又满足高并发场景下的工业级性能要求,为RAG系统落地提供了可落地的技术路径。
2026-05-20 18:50:48
381
原创 2026年全球向量数据库技术全景与架构演进深度解析报告
摘要: 2026年,向量数据库市场因AI技术发展迎来范式转移。检索增强生成(RAG)技术推动向量数据库成为核心基础设施,需求从基础功能转向高性能、低成本解决方案。新一代嵌入模型带来高维数据挑战,混合检索(结合语义、关键词和元数据过滤)成为企业级标准。成本压力促使压缩算法和存算分离架构兴起。底层技术围绕距离度量(如欧几里得、余弦相似度)和近似最近邻算法(如HNSW、IVF-PQ)优化,平衡精度与效率。HNSW虽快但内存消耗大,IVF-PQ通过聚类和量化降低资源需求,成为超大规模部署的关键。企业需根据业务场景选
2026-05-19 17:55:06
457
原创 吃透 Spring Cloud Gateway:基于 Spring Boot 3 的核心原理、企业级实战与避坑指南
本文基于Spring Boot 3.3+和Java 17,深入解析Spring Cloud Gateway作为微服务网关的核心优势与实践。文章首先对比了Gateway与Zuul的性能差异,强调其异步非阻塞架构和Netty底层带来的高并发优势。随后详细剖析了路由、断言和过滤器三大核心概念的工作原理,并提供了完整的请求处理生命周期图解。实战部分包含最新环境配置指南,重点提示了依赖管理和Nacos集成的关键注意事项,最后通过JWT鉴权案例展示了全局过滤器的实现。全文聚焦企业级应用场景,为开发者提供从原理到落地的全
2026-05-19 17:34:31
434
原创 万字详解:RAG 向量索引算法与向量数据库架构及实战
本文深入解析RAG架构中向量检索的核心技术,指出检索系统质量决定回答上限。从数学原理出发,详细介绍了向量与Embedding的语义映射、相似度度量方法(余弦、欧氏、内积),以及精确检索KNN与近似检索ANN的区别。重点剖析了四大主流向量索引算法:基于树的Annoy、基于哈希的LSH、基于量化的IVF-PQ/SQ,以及基于图的HNSW,分析其原理、构建过程、查询机制及优缺点。特别强调量化技术的内存优化价值,以及HNSW作为高性能首选算法的分层设计。为RAG场景下的向量数据库选型与优化提供了理论依据和实践指导。
2026-05-19 16:53:51
604
原创 大模型量化技术实战指南
大模型量化技术综述:从理论到实践 本文系统介绍了大语言模型量化技术的关键原理与实践方法。首先分析了量化技术对大模型落地的重要性,指出量化可将70B参数模型的显存需求从140GB压缩至35GB,实现消费级显卡部署。文章详细阐述了浮点数(FP32/FP16/FP8)和定点数(INT8/INT4)的数值表示原理,以及量化映射的数学本质。随后深入对比了PTQ(后训练量化)和QAT(量化感知训练)两大技术流派,包括完整流程、核心挑战和解决方案。PTQ适合快速部署,而QAT在极端低比特场景下精度更高但训练成本较大。文章
2026-05-17 10:19:47
465
原创 AI Agent 记忆机制全景对比:OpenClaw vs QwenPaw vs Hermes vs HiClaw
本文对比分析了四大主流开源Agent(OpenClaw、Hermes Agent、QwenPaw、HiClaw)的记忆系统实现方案。从存储架构看,OpenClaw和QwenPaw采用向量化路线,Hermes则独创FTS5+LLM摘要的轻量级方案;检索策略方面,OpenClaw支持混合检索,Hermes专注关键词检索+LLM提炼;写入机制上,Hermes独有的KEPA反向传播和Agent策展功能最具特色。各系统在记忆生命周期管理上也呈现明显差异:OpenClaw采用压缩刷新机制,Hermes实现双状态管理,Q
2026-05-17 09:43:05
831
原创 智能体 Agent 完全拆解:架构、组件与实战指南
**智能体(Agent)是一种能够自主感知环境、制定计划并执行行动的AI系统,其核心架构包含六大组件:1)大脑LLM负责推理决策;2)规划模块拆解复杂任务;3)工具集实现外部交互;4)记忆系统管理短期与长期信息;5)感知层处理多模态输入;6)行动循环通过ReAct模式迭代执行。这些组件协同工作,使Agent具备类人的任务处理能力,典型应用包括AutoGPT等框架。关键技术涉及思维链推理、函数调用和向量数据库等,推动AI从被动响应迈向主动协作。
2026-05-17 09:20:07
478
原创 封神级 TTS!VoxCPM2 凭连续表征,玩转多语言合成 + 创意音色 + 无损声纹克隆
VoxCPM2是OpenBMB与清华大学合作开发的开源TTS模型,采用连续表征扩散自回归架构,直接生成48kHz高质量语音。模型参数量达20亿,基于MiniCPM-4框架,支持30种语言和9种中文方言,并具备音色设计与可控声音克隆功能。
2026-05-02 17:43:14
479
原创 本地大模型部署指南:16G/32G/64GB内存配置全解析(附最新模型速查表)
本文针对不同内存配置(16GB/32GB/64GB)提供了本地大模型选型指南。16GB设备推荐2B-9B量级模型如Qwen3.5 9B,32GB可运行27B-35B级别模型如Qwen3.5 27B,64GB则能驾驭70B级旗舰模型和视觉多模态应用。文章详细列出了各场景下的最优模型组合,并解释了GGUF量化等级的选择策略,帮助用户根据硬件条件平衡模型性能与推理质量。
2026-04-24 11:03:37
1070
原创 多 AI 编码工具技能乱套?skills-manage 一站式统一管理全平台 Agent Skills
AI技能管理神器skills-manage重磅发布!这款开源桌面工具通过中央技能库+软链接同步技术,彻底解决多AI平台技能管理难题。核心功能包括:1)统一管理20+主流AI编码工具技能;2)可视化查看、安装/卸载技能;3)支持本地项目、GitHub和市场多渠道导入;4)技能集合批量管理。采用Tauri框架开发,具有轻量高性能、隐私安全、跨平台等特点,支持macOS/Windows/Linux系统。开发者可免费下载使用,实现"一次安装,全平台通用",告别技能重复配置和版本混乱问题。
2026-04-24 09:11:30
732
原创 Agent Skills 深度解析:AI 编码代理的工程化生产级工作流引擎
Agent Skills 是一套由 Addy Osmani 设计的工程化框架,旨在解决当前 AI 编码代理的短视化开发问题(如跳过测试、忽视安全)。该框架通过标准化工作流、质量门禁和反合理化机制,强制 AI 代理遵循生产级研发流程,输出工业级代码。其核心架构包括六阶段研发生命周期(定义、规划、构建、验证、审查、交付)、20 项结构化技能(如规格驱动开发、TDD、安全加固)及七层命令映射体系(如 /spec、/test)。通过角色层(审查专家)和参考层(核查清单)的协同,确保代码质量、安全与性能,兼容
2026-04-22 18:25:21
510
原创 大模型推理部署框架深度解析:核心技术原理与实践指南
大模型推理部署面临算力成本高、响应延迟和吞吐量瓶颈等挑战。本文系统分析了主流推理框架的核心技术,包括KV Cache缓存优化、PagedAttention分页管理、Continuous Batching批处理、推测解码和量化技术等,显著提升了推理效率。重点介绍了vLLM等框架如何通过创新架构实现显存利用率从40%提升至95%以上,吞吐量增加3-10倍。文章还探讨了Prefill-Decode分离架构和NVFP4等前沿量化技术,为企业选择最优部署方案提供参考。
2026-04-21 10:31:48
614
原创 大模型格式转换全解析:从训练到部署的完整技术路线与最佳实践
大模型格式转换是连接训练与部署的核心技术环节。本文从技术原理、实现方案和性能优化三个维度,系统剖析了safetensors、ONNX、GGUF等主流格式的底层机制与转换策略。重点分析了计算图优化、量化压缩(Q4_K_M/Q5_K_M)等关键技术,对比了不同格式在训练存储、中间转换和推理部署阶段的适用场景。针对CPU/GPU不同硬件平台,提供了完整的格式转换技术路线,包括环境配置、模型验证、量化策略选择等实操方案,为工程落地提供系统性的技术参考。
2026-04-20 14:16:45
390
原创 2026年向量数据库选型指南:Qdrant、Pinecone、Milvus、Weaviate 与 Chroma 深度解析
本文对比分析了五大主流向量数据库(Qdrant、Pinecone、Milvus、Weaviate和Chroma)的技术特性及应用场景。Qdrant以高性能和灵活性见长,适合中大型RAG应用;Pinecone提供全托管服务,适合无运维需求的场景;Milvus擅长处理超大规模数据;Weaviate具备混合搜索优势;Chroma则适合快速原型开发。文章还结合Dify、Coze等平台给出了选型建议,并提供了基于数据规模、运维能力和搜索需求的决策树。综合推荐Qdrant作为通用生产首选,Pinecone为最佳托管服务
2026-04-19 15:42:20
1040
原创 PageIndex技术全解析:基于推理的无向量RAG框架,重构长文档智能检索范式PageIndex 是一个创新的、无向量
《PageIndex:颠覆传统RAG的长文档处理新范式》技术解析: 本文深入剖析了传统向量RAG在长文档处理中的四大痛点:文本切片导致的上下文割裂、语义相似度与相关性脱节、结构化信息丢失及可解释性差。VectifyAI开源的PageIndex创新性提出"结构索引+推理导航"技术路线,通过构建文档层级语义树(PageTree),模拟人类专家的阅读逻辑实现精准检索。该方案摒弃向量数据库依赖,支持完整上下文保留和全链路追溯,在金融、法律等专业场景中展现出显著优势。其核心突破在
2026-04-19 12:22:13
559
原创 前端小白也能懂!实时消息小红点学会使用 RabbitMQ 推送消息
WebSocket 是一种在单个 TCP 连接上进行全双工通信的网络协议。它使用 HTTP/1.1 协议进行初始握手,并在随后的通信中切换到全双工模式。WebSocket 的应用场景包括在线聊天室、多玩家在线游戏、实时协作和数据可视化等。客户端使用 JavaScript API new WebSocket(url) 创建一个 WebSocket 对象。客户端通过 WebSocket.send(data) 方法向服务器发送数据。
2023-06-19 17:23:52
3581
原创 Vuex 核心思想: 状态管理模式解析与源码实现
状态管理模式,又称为 Flux 架构模式,是一种前端架构模式。基于这种模式,我们把数据(应用状态)存储到单一的地方 —— Store 中。组件之间通过触发 Action 来更新应用状态,再由 Store 对相应的 Mutation 进行响应式更新,最终展示在组件中。这种方式可以有效的解决多个组件之间数据的同步问题。在Vuex中定义Action,需要在modules中对应的store文件下进行编写。
2023-06-19 17:18:46
416
原创 Async/Await:优雅、简洁地通过同步的方式实现异步
在 JavaScript 的异步编程中,我们经常使用回调函数、Promise 和 Async/Await 来解决异步操作的问题。而 Async/Await 又是 Promise 的语法糖,它的出现让异步编程变得更加直观和易于理解。本文将详细讲解 Async/Await 如何通过同步的方式实现异步。
2023-06-18 23:56:57
1614
原创 JS 遍历对象数组的方式
需要注意的是,以上提到的方法都是比较老的方式,对于复杂的对象数组可能不够灵活。注意,对于一个对象数组,可以使用以上方法遍历其中所有的对象元素。但是,对于某个对象元素本身的属性,还需要使用其他方式进行遍历。注意,此方法并不能保证遍历顺序。使用 forEach 方法遍历对象数组,相比于 for 循环,具有更加简洁的语法和更高的可读性。of 循环遍历对象数组,适用于需要遍历对象属性的场合,从 ES6 引入。需要注意的是,以上提到的方法都是 ES5 引入的新特性,使用时需要注意浏览器兼容性问题。
2023-05-05 14:40:13
2402
原创 谈谈ArrayList和LinkedList的区别?
ArrayList和LinkedList是Java编程语言中两种常见的集合类,它们在数据结构、内存消耗、随机访问性能、插入和删除性能等方面存在一些区别。当需要频繁随机访问元素的时候,例如读取大量数据并进行处理或者需要对数据进行排序或查找的场景,可以使用 ArrayList。例如一个学生管理系统,需要对学生列表进行排序或查找操作,可以使用 ArrayList 存储学生信息,以便快速访问和处理。
2023-04-13 11:14:41
340
原创 Vue使用lodash进行防抖节流
函数会返回一个新函数,该函数会在最后一次调用时延迟指定时间再执行,而在此之前的调用都会被忽略;的新函数,该函数会在最后一次调用之后等待 1000 毫秒再执行,这样就实现了防抖的效果。的新函数,该函数会在每个指定时间间隔内最多执行一次原函数,这样就实现了节流的效果。函数定义在循环外部,然后在循环中只保存生成的函数,而不是每次都生成一个新的函数。函数则会返回一个新函数,在指定时间内最多执行一次,多余的调用都会被忽略。函数返回一个新的函数,该函数会在最后一次调用之后指定的时间内执行。然后,我们定义了一个名为。
2023-04-10 14:21:45
1106
原创 Oracle导入数据库方法
Oracle导入数据库方法在使用oracle导入dmp数据库时的几个步骤如下:-- 1.创建临时表空间create temporary tablespace TEST_TEMPtempfile 'D:\app\data\TEST_TEMP.dbf'size 50mautoextend on next 50m maxsize 1024mextent management local-- 2.创建表空间create tablespace TESTdatafile 'D:\app\data\
2021-06-27 20:55:27
2384
原创 EasyEnsemble(集成学习——处理不平衡样本分类问题)
(1, 2) X. Y. Liu, J. Wu and Z. H. Zhou, “Exploratory Undersampling for Class-Imbalance Learning,” in IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), vol. 39, no. 2, pp. 539-5...
2019-01-07 19:32:47
13109
转载 学习STM32必须了解的五大嵌入式操作系统
基于STM平台且满足实时控制要求操作系统,有以下5种可供移植选择。分别为μClinux、μC/OS-II、eCos、FreeRTOS和rt-thread。下面分别介绍这五种嵌入式操作系统的特点及不足,通过对比,读者可以根据自己的应用需求选择合适的平台。TOP1:μClinuxμClinux是一种优秀的嵌入式Linux版本,其全称为micro-control Linu
2018-01-25 09:56:31
754
原创 学习笔记:从EXCEL文件中导入数据
从已知的Excel文件中读取一个样本数据集合:1.打开文件的工作簿2.根据名称找到工作表:根据行数(nrows)和列数(ncols)读取单元格的内容3.打印出读取的数据集合import xlrdfrom pprint import pprintfile='test.xlsx'wb=xlrd.open_workbook(filename=file)ws=wb.sheet_...
2018-01-24 10:10:12
391
原创 学习笔记:从CSV文件导入数据
从CSV文件导入数据代码段:import csvfilename = 'test.csv' data = [] try: with open(filename) as f: reader = csv.reader(f) header = next(reader) data = [row for row in reader] excep
2018-01-24 09:52:24
598
基于随机森林的个人信用评估模型研究及实证分析
2018-01-26
sklearn学习指南
2018-01-26
LightGBM-GPU 安装包已编译
2018-11-20
软件测试与质量保证理论与实践(书)
2018-03-12
目前市场上嵌入BI到自己的系统做的最好的厂商有哪些?
2021-06-06
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅
1