一休哥助手-CSDN博客

原创 SDK技术深度解析：从概念到实践的完整指南

软件开发工具包（Software Development Kit，SDK）是现代软件开发生态系统的核心组成部分，它通过提供预构建的工具、库和文档，显著降低了开发复杂性并加速了应用交付。本文将深入探讨SDK的核心概念、架构设计、开发实践以及未来发展趋势，为开发者提供全面理解SDK技术内涵和实践应用的权威参考。

2025-12-15 20:00:00 1101

原创深度解析 Cursor 2.2：让 AI 开发工具更智能、更可视、更高效

在 2025 年 12 月中旬，AI 编程环境 Cursor 2.2 正式发布。这是 2.x 系列的一个重要升级版本，专注于增强计划规划、调试能力、多代理协同、可视化和智能评判机制。本文将从整体设计、核心新特性、工作流程、内部原理、实战案例等维度进行全面解析，帮助你快速掌握 Cursor 2.2 的真谛。

2025-12-15 08:00:00 234

原创 LiteFlow规则引擎深度解析：构建灵活可编排的Java业务逻辑

LiteFlow是一款轻量级规则引擎，创新性地融合了规则引擎与编排引擎特性。其核心设计采用组件化思维，将复杂业务逻辑拆分为独立组件，通过规则文件灵活编排，实现松耦合、可复用和热更新等优势。文章详细解析了LiteFlow的三层架构（规则解析层、组件执行层、上下文管理层），并提供了Spring Boot整合实战指南，包括组件开发、规则定义和流程触发方法。LiteFlow特别适用于价格引擎、下单流程等复杂业务场景，能显著提升开发效率和系统可维护性。

2025-12-14 23:08:49 75

原创 DiT（Diffusion Transformer）：颠覆图像生成的Transformer革新

Diffusion Transformer（DiT）是近年来计算机视觉领域最具突破性的架构之一，它成功地将Transformer架构引入扩散模型，取代了传统的U-Net主干网络。DiT不仅继承了Transformer的卓越扩展性和训练稳定性，还在ImageNet 256×256和512×512生成任务上取得了2.27 FID的顶尖结果，显著超越了此前基于U-Net的扩散模型。本文将深入剖析DiT的核心原理、架构设计、关键技术以及未来发展趋势，为读者提供全面理解DiT技术内涵和实践应用的权威参考。

2025-09-30 10:25:35 1454

原创 Serverless架构：无服务器计算的全面解析与实践指南

Serverless架构是云计算发展的重要里程碑，它让开发者能够更专注于业务逻辑而非基础设施管理。本文将深入探讨Serverless的核心概念、架构模式、技术实现以及最佳实践，帮助读者全面理解这一颠覆性的技术范式，并为企业技术选型提供实用指导。

2025-09-29 19:08:22 1449

原创 Apache Flink：流处理革命的领导者与新一代大数据计算引擎

Apache Flink是一个开源的流处理框架，以其高吞吐、低延迟、精确一次处理的特性成为实时计算领域的领导者。本文将从Flink的核心架构、编程模型、容错机制到实际应用场景，全面解析这一新一代大数据计算引擎的技术原理与实践应用，为读者提供从入门到精通的完整指南。

2025-09-29 10:22:12 1330

原创测试覆盖率：从度量到优化的完整工程实践指南

测试覆盖率是衡量软件测试完整性的重要指标，它反映了测试用例对代码的覆盖程度。本文将深入探讨测试覆盖率的理论基础、度量方法、工具实践，以及如何在实际项目中有效利用覆盖率指标提升软件质量。通过全面的分析和实践案例，为读者提供测试覆盖率从入门到精通的完整指南。

2025-09-28 19:13:04 1177 4

原创 CDN技术深度解析：从原理到未来发展的内容分发网络全景指南

内容分发网络（Content Delivery Network，CDN）作为互联网基础设施的关键组成部分，通过智能调度和边缘缓存技术显著提升用户访问体验。本文将全面解析CDN的工作原理、架构设计、关键技术，并结合最新技术趋势，探讨CDN在5G、AI和边缘计算时代的发展方向。

2025-09-28 12:34:24 1303

原创 Apollo配置中心：架构解析与生产实践指南

Apollo（阿波罗）是携程开源的**分布式配置管理中心**，能够集中化管理应用不同环境、不同集群的配置，配置修改后能够**实时推送到应用端**，并且具备规范的权限、流程治理等特性。本文将深入剖析Apollo的架构设计、工作原理，并结合实际部署和使用经验，为企业在微服务架构下实现高效的配置管理提供全面指导。

2025-09-27 17:00:00 1177

原创消息队列深度解析：从基础概念到架构实践的完整指南

消息队列已成为现代分布式系统架构的核心组件，超过85%的中大型企业采用该技术。文章系统介绍了消息队列的基础概念、演进历程和核心价值，包括系统解耦、异步处理、流量削峰和数据一致性等关键作用。详细解析了消息队列的架构模型、工作模式（点对点、发布/订阅）以及核心特性（持久化、确认机制、顺序性、事务消息）。最后对比了Kafka、RabbitMQ等主流技术，为开发者提供从原理到实践的完整指南。

2025-09-27 09:00:00 1022

原创 AI编程工具深度对比：Cursor、Copilot、Trae与Claude Code，2025年开发者该如何选择？

2025年AI编程工具市场已形成四大主力阵营：Cursor（AI原生IDE）、GitHub Copilot（行业标准）、Trae（中国免费方案）和Claude Code（终端交互）。核心差异体现在技术能力（代码生成准确率85%-95%）、智能体协作程度和上下文处理能力（8K-200K tokens）。用户体验方面，Trae对中文支持最佳且免费，Copilot企业集成强，Cursor平衡易用与功能，Claude Code适合高阶开发者。实际测试显示，不同工具在原型开发、算法实现等场景各有优势

2025-09-25 18:37:14 3482

原创 Spring AI MCP Client 完全指南：配置、集成与实战解析

Spring AI MCP Client作为MCP协议在Java生态的实现，解决了AI模型安全访问外部工具和数据源的难题。文章详解了MCP协议的核心架构（Tools/Resources/Prompts）及标准化交互方式，并通过Spring Boot项目配置指南（STDIO/SSE传输协议）展示其应用。重点介绍了自动工具发现、多协议选型策略及企业级高级配置（超时/重试），最后以天气查询服务为例，演示了MCP Client的实际集成方法，为开发者提供从基础到进阶的完整实践方案。

2025-09-25 10:19:20 682

原创字节 TRAE：AI 原生 Coding Agent 的工程化架构与实战落地

AI编程范式正经历革命性演进，字节跳动TRAE平台代表了当前最先进的AI原生开发范式。TRAE采用多智能体协作框架，支持从需求分析到部署的全流程自动化开发，效率最高可提升85%。其核心技术包括：1）多智能体分工协作（代码生成、性能优化等）；2）Test-time Scaling机制提升问题解决能力；3）创新的上下文管理策略。通过MCP协议，TRAE实现与Figma等工具的无缝集成，支持设计稿直接生成代码。实战案例显示，TRAE已帮助开发者大幅缩短项目周期，展现了AI作为真正开发协作伙伴的潜力。

2025-09-22 10:32:04 1116

原创 Awesome MCP Servers：大模型与外部世界连接的全景指南

MCP协议为AI大模型提供标准化接口，实现与外部工具和数据源的交互。该协议采用三层架构（传输层、消息层、资源层），支持多种技术实现方式。官方和社区已开发数百个MCP服务器，覆盖代码开发、网络搜索、多媒体处理、数据分析等领域，如OpenAI代码解释器、GitHub仓库浏览器等。企业级解决方案整合了AWS、Azure等云服务，并针对医疗、金融等行业提供专业支持。服务器开发需考虑安全性（OAuth2认证）、性能优化（缓存、异步处理）和标准化设计模式（适配器、工厂模式）。

2025-09-18 10:40:29 1422

原创大模型无需懂MCP：工具调用范式的架构革命与实践指南

本文提出一种新型AI智能体架构范式，让大模型专注于决策和指令生成，而无需理解底层协议细节。核心设计包括：1）分层架构（大模型层、适配层、协议层、工具层），实现关注点分离；2）通过标准化工具描述（功能、参数、示例）指导模型调用；3）支持多种调用模式（直接调用、组合调用、条件判断）和自动错误恢复机制。以电商助手为例，展示了模型如何基于工具列表生成指令，完成商品搜索、比价等任务。这种设计充分发挥大模型在意图理解上的优势，同时将协议解析等复杂性交由中间层处理，提升系统整体效率和可维护性。（149字）

2025-09-17 19:49:11 1372

原创 Charles移动端抓包实战指南：从入门到精通HTTPS流量解析

本文系统介绍Charles在移动端网络调试中的应用。作为主流抓包工具，Charles通过中间人代理架构拦截HTTP/HTTPS流量，支持实时查看和修改请求响应。文章详细讲解了环境配置、证书安装、HTTPS解密等基础操作，并深入解析断点调试、弱网模拟、请求重写等高级功能。针对移动端特有的SSL Pinning和高版本Android限制，提供了实用解决方案。通过春雨医生APP的实战案例，演示了完整的接口分析流程。最后给出最佳实践建议，包括会话管理、过滤技巧及法律合规提醒。掌握Charles能显著提升移动开发调试

2025-09-17 10:24:28 1761

原创 MCP Registry：连接大模型与外部世界的智能枢纽

MCP Registry作为大语言模型生态的"中枢神经系统"，通过集中管理MCP服务器的注册与发现，解决了AI模型与外部系统集成的关键挑战。阿里巴巴Nacos作为典型实现，创新性地支持存量API"0代码"升级为MCP服务，通过协议转换与动态元数据管理降低改造成本。其核心功能包括服务注册发现、元数据管理、健康检查及灰度发布等，已成功应用于Dify平台集成、AI导购等场景。尽管面临标准化与成熟度等挑战，未来向去中心化架构、安全增强等方向发展，MCP Registry将持续推动LLM与工具生态的高效协同。

2025-09-16 19:06:09 1059

原创 Charles抓包神器完全指南：从入门到精通网络调试

在移动互联网时代，网络请求的可见性已成为开发、测试和优化的关键。Charles作为一款专业的HTTP/HTTPS抓包工具，通过中间人代理技术让开发者能够清晰查看、分析和修改客户端与服务器之间的所有网络通信，大幅提升开发调试效率。

2025-09-16 10:19:22 871

原创 Gradle深度解析：从构建工具到开发生态系统

Gradle已发展为功能强大的构建生态系统，成为Android官方构建工具和大型项目的首选。它凭借卓越性能（增量构建、缓存机制）、高度灵活性（Groovy/Kotlin DSL）和丰富插件生态显著优于Maven和Ant。Gradle的核心基于项目(Project)和任务(Task)概念，遵循初始化、配置、执行三阶段生命周期。实战应用涵盖基础脚本编写、多项目构建配置，以及自定义任务与插件开发能力，满足从简单到复杂的构建需求。其模块化设计和可扩展性使Gradle成为现代软件开发中不可或缺的构建工具。

2025-09-15 18:50:47 988

原创 AI智能体意图识别优化：从基础原理到高级策略的全方位指南

研究显示，意图识别准确率每提升1%，用户满意度平均提升2.3%，凸显其作为智能体交互核心的重要性。意图识别技术经历了从规则方法到深度学习（如BERT、GPT）的演进，现代系统采用多阶段架构处理用户输入，包括文本预处理、特征提取、意图分类和槽位填充等模块。优化策略涵盖数据增强（如同义词替换、回译）、难例挖掘和主动学习，可显著提升模型性能。当前，意图识别已成为AI应用落地中最关键的技术瓶颈之一，其准确度直接影响智能体交互体验的质量和效率。

2025-09-15 10:26:47 1435

原创 Apache Thrift：跨语言服务开发的高性能RPC框架指南

Apache Thrift是一款跨语言RPC框架，由Facebook开发并开源，现为Apache顶级项目。其核心优势在于卓越性能、跨语言支持（20+编程语言）和高效的开发流程（通过IDL定义接口并自动生成代码）。Thrift采用分层架构设计，包含传输层、协议层和服务层，支持多种传输协议和服务模型。开发时需先编写IDL文件定义服务接口，再使用代码生成工具生成目标语言代码，最后实现服务端和客户端逻辑。Thrift特别适合构建高性能的微服务和分布式系统，大幅简化了不同语言服务间的通信难题。

2025-09-12 19:15:51 967

原创生产级AI智能体落地：LLM可观测性架构与实践指南

2025年，超40%的自主智能体项目将因不可控风险失败，可观测性成为AI智能体生产的核心基础设施。智能体需监控决策合理性、公平性、准确性及幻觉风险，区分于传统软件的可观测性（Observability）、监控（Monitoring）和可解释性（Explainability）。中国信通院提出五层架构模型（基础设施、中间件、模型、服务、应用层），覆盖性能、行为、安全与业务维度。关键技术包括数据采集、分布式追踪（如阿里AgentScope框架）及智能体专属指标（任务完成率、成本控制等）。生产实践需结合硬约

2025-09-12 13:46:06 1059

原创上下文工程：AI应用成功的关键架构与实践指南

在AI应用开发中，模型能力只决定性能上限，而上下文质量决定性能下限——上下文工程正是确保AI系统理解用户意图、生成准确响应的核心工程技术，已成为区分普通AI应用与卓越AI应用的关键因素。

2025-09-05 14:33:32 1423

原创飞算JavaAI全面解析：重塑Java开发流程的智能引擎

飞算JavaAI是全球首款专注Java的智能开发助手，通过AI技术实现全流程开发革命。它能破解传统Java开发中的重复编码、需求偏差等问题，支持自然语言生成代码、智能补全和重构。核心功能包括五步引导开发流程、AI驱动测试和智能运维。实战案例显示，它可快速生成电商系统完整代码，自动处理复杂场景如订单超时取消。3分钟即可完成安装配置，显著提升开发效率。

2025-09-04 18:00:00 1960

原创飞算JavaAI：重塑Java开发范式的智能引擎

飞算JavaAI是全球首款专注于Java的智能开发助手，通过AI技术重构Java开发全流程。它采用三层智能引擎（语义理解、代码生成、运行时优化），解决传统开发中重复编码、需求偏差、技术债务等痛点，提升效率10倍以上。核心功能覆盖需求分析到系统部署，支持多行业场景如金融风控、工业预测维护等。相比通用工具，飞算JavaAI在Java领域更具深度，能生成完整工程级代码，大幅降低开发时间。未来将向行业模板库、自适应架构等方向发展，推动Java开发进入智能新时代。

2025-09-04 09:39:22 1112

原创从结构化到多模态：RAG文档解析工具选型全指南

文档解析质量是RAG系统效果的关键瓶颈，直接影响80%企业知识库信息的准确提取。本文系统分析了PDF、Word等主流格式的解析挑战，对比了OCR-PIPELINE、OCR-FREE等技术路线的优劣，并评估了Marker、MinerU等前沿工具的性能特点。研究提出五维评估模型（精度、性能、功能、成本、安全），针对学术研究、企业知识库等不同场景给出选型建议，强调模块化架构设计对复杂文档处理的重要性。实践表明，合理的解析工具选择可提升RAG系统70%的检索准确性。

2025-09-02 18:13:28 948

原创 HiMarket：开源AI中台革命——企业智能化的新基建

摘要： HiMarket是一款开源AI中台解决方案，帮助企业解决AI应用规模化落地的核心痛点，包括能力孤岛化、流程非标准化、权限管理复杂等六大问题。其核心架构包含AI开放平台管理后台、门户、AI网关和Nacos集成，支持统一AI资产管理、多场景应用及成本控制。通过标准化API封装，HiMarket加速企业AI能力的分发与商业化，降低80%重复开发工作，助力企业聚焦核心价值创造。未来将探索AI辅助开发、智能路由等增强功能，推动企业AI生态建设。

2025-09-02 09:33:52 1211

原创 2025年AI智能体开源技术栈全面解析：从基础框架到垂直应用

2025年开源AI智能体技术迎来爆发式发展，市场预计以44.8%年增速增长至471亿美元。主流框架形成技术分层，LangChain、CrewAI和AutoGen三大核心框架各具特色，分别擅长工作流构建、多智能体协作和对话系统。技术创新聚焦三大方向：工具扩展（计算机操控、语音集成、文档处理）、记忆管理（分层架构、向量检索）和评估监控（测试框架、行为追踪）。行业应用已覆盖金融、医疗、电商等领域，典型案例显示异常检测率提升40%、转化率提高22%。开源生态正推动AI智能体向更复杂、多模态的协作系统演进。

2025-09-01 18:49:57 1467

原创 AI智能体架构设计的三阶段演进：从单一到编排的智能革命

从ChatGPT的单体对话，到AutoGPT的自主任务处理，再到CrewAI的多智能体协作。这一演进由任务复杂度提升、专业化需求和资源优化驱动，分为三个阶段：1)单一智能体阶段（2022-2023）基础能力构建但受限；2)多智能体协作阶段（2023-2024）实现角色分工与复杂任务分解；3)智能体编排阶段（2024-2025）系统化混合架构。多智能体系统通过专业化分工解决单体架构的能力瓶颈，但也面临通信效率、一致性维护等挑战。典型应用如CrewAI通过项目经理、研究员、分析师等角色协作

2025-09-01 09:42:03 1069

原创物理AI：连接数字智能与物理世界的下一代人工智能范式

物理AI正在推动人工智能从纯数字领域向物理世界扩展，实现比特到原子的智能跃迁。与传统AI相比，物理AI具有三大核心差异：1）在物理环境中运行；2）处理多模态传感器输入；3）产生可改变物理状态的输出。其技术栈包含感知层（多模态融合）、决策层（边缘计算）、执行层（运动控制）和连接层（5G/6G通信）。关键技术挑战包括：实时多传感器融合、物理约束下的决策规划、以及高精度执行控制。物理AI的发展面临实时性保障、安全验证等核心挑战，但其在机器人、自动驾驶等领域的应用潜力巨大，正成为智能技术落地的关键突破口。

2025-08-29 18:43:21 1438

原创自适应RAG架构：智能检索增强生成的演进与实现

传统RAG系统采用固定检索模式，难以适应复杂多变的查询场景。自适应RAG通过动态调整检索策略，实现了效率与准确性的平衡。其核心是查询复杂度分类器，将查询分为简单、中等、复杂三类，分别采用无检索、单步检索和多步检索策略。关键创新包括多策略检索机制、基于笔记的知识积累和动态路由决策。先进框架如DeepNote和LightRAG通过结构化知识表示和图检索显著提升性能，在多项基准测试中准确率提高20%以上，同时减少30-50%计算开销。实践指南建议采用SBERT/GTE嵌入模型和混合索引技术构建企业级系统。

2025-08-29 09:34:03 1384

原创混合RAG架构：下一代企业级检索增强生成的融合之道

2025年，企业级RAG系统正面临前所未有的复杂挑战——单一检索策略在真实业务场景中的局限性日益凸显，而混合RAG架构通过有机融合多种检索范式，将系统准确率从68%提升至92%，成为解决"检索精度-召回率-延迟"不可能三角的关键突破。

2025-08-27 18:40:07 1101

原创 Graph RAG：基于知识图谱的下一代检索增强生成架构

2025年，Graph RAG通过结合知识图谱的结构化语义与RAG的生成能力，显著提升复杂推理性能。相比传统RAG在多跳问答中68%的失败率，Graph RAG实现了72%的准确率提升，其核心优势包括：1）结构化知识表示保留实体关系；2）显式路径支持多跳推理；3）增量更新降低维护成本。架构包含图构建管道（实体识别、关系提取）、混合检索引擎（关键词+语义搜索）及图推理模块（多跳路径分析），支持从非结构化数据到可解释答案的全流程处理，为知识密集型任务提供更高效的解决方案。

2025-08-27 09:32:50 837

原创多模态RAG架构：下一代跨模态智能检索系统的设计与实践

多模态RAG技术正在颠覆传统文本检索系统，通过融合文本、图像、表格和公式等多模态信息，将富文档处理准确率从不足50%提升至85%以上。其核心价值在于解决传统RAG系统的两大局限：信息表征缺失（忽略视觉语义）和模态交互受限。典型架构包含多模态查询理解、混合索引召回、精排和增强生成四大模块，关键技术包括统一多模态嵌入空间、智能分块策略和多路召回融合算法。先进框架如RAG-Anything和Taichu-mRAG通过端到端处理管道和双层级索引实现了33%的问答准确率提升。

2025-08-26 18:44:25 1089

原创 Corrective RAG：下一代自校正检索增强生成架构解析与实践

2025年，Corrective RAG（校正型RAG）通过多级自我校正机制显著提升企业级知识系统的可靠性，将传统RAG的幻觉率从15-30%降至3%以下，准确率提高42%。其核心架构包含检索校正模块（轻量级评估相关性）、知识增强策略（动态选择知识源）和生成校正模块（自我检查机制），通过轻量级模型（如微型BERT）实现高效评估，并采用多因素决策算法优化校正流程。这一创新使CRAG成为高可靠性场景的首选方案。

2025-08-26 09:35:06 603

原创 HyDE：假设文档嵌入——重新定义检索增强生成的架构革命

HyDE技术突破传统RAG瓶颈，通过大模型"想象"理想答案提升检索准确率40%2025年，HyDE（假设文档嵌入）技术通过创新性方法解决RAG系统的核心痛点：核心突破：让LLM先生成假设答案文档，再以其为基准检索，实现从"查询匹配"到"答案匹配"的范式转换技术优势：三阶段流程（生成假设文档→嵌入转换→相似度检索）有效解决语义/词汇不匹配问题在HotpotQA数据集上实现82.4%准确率（较传统方法提升40%）关键优化：领域定制化提示工程多阶段重排序策略低随机性生成控制（温度参数0.2-0

2025-08-25 09:26:33 1187

原创 Naive RAG：简单而高效的检索增强生成架构解析与实践指南

2025年Naive RAG仍是企业首选：75%企业采用该架构，因其简单稳健（部署2-3周/成本<$50K），在客服等场景中准确率提升20%+。核心架构包含检索、生成、知识库三模块，通过标准化文本预处理（清洗/分块/向量化）和混合检索策略（余弦+BM25）平衡效果与成本。面临检索精度、多跳推理等七大挑战，可通过混合搜索、查询扩展等技术优化。技术栈推荐text-embedding-3-small+Chroma+GPT-4-turbo组合，适合预算有限的中型企业快速落地AI应用。

2025-08-21 18:31:45 1220

原创 LLM、RAG、Workflow、Agent：2025年AI大模型落地选型终极指南

2025年企业AI落地面临技术选择悖论，项目失败率高达65%。本文提出科学选型框架，解析四大技术体系：LLM基础模型适合创意生成和简单问答；RAG方案在实时性、专业领域和数据安全场景优势显著；Workflow工作流适用于流程标准化任务；Agent智能体则胜任复杂决策需求。通过五维评估矩阵（场景复杂度、数据需求、灵活性、成本、开发周期）和混合架构方案，帮助企业规避技术错配、成本失控等风险。金融推荐RAG+Workflow+Agent混合架构，医疗适用Agentic RAG，电商则采用多Agent分工协作模式。

2025-08-21 09:19:07 1858

原创 Deepresearch Agents：下一代自动研究智能体的架构革命与产业实践

2025年，Deepresearch Agents正以每月35%的增速重塑知识产业，年产值达420亿美元。其四层认知引擎（规划、检索、验证、生成）实现研究流程自动化，将耗时从2-8周缩短至4小时。核心突破包括多轮反思机制（准确率提升至94%）、抗幻觉技术（置信度阈值0.8）及跨学科知识融合。在医药研发领域，化合物筛选时间从18个月降至3周；金融研究方面实时监控2000+数据源；政策分析覆盖8大产业+供应链。该技术正将人类研究者从80%的机械性工作中解放，推动各行业研究范式变革。

2025-08-20 18:27:48 1735

原创 Coding Agents：AI编程智能体的技术架构与产业实践

2025年，AI编程智能体(Coding Agents)以每月20%的增速重塑开发流程，实现从代码补全到系统级协作的跃迁。其核心MCP架构（记忆层、控制层、规划层）支持全局代码分析、安全重构和工具链整合，性能超越传统工具60%以上。典型应用包括金融系统迁移（成本降低92%）、智能制造优化（良品率提升5.8%）和低代码开发（非技术人员占比达35%）。关键技术突破在于强化学习优化框架和混合云部署方案，但需警惕权限失控风险（某案例损失150万美元）。这标志着软件开发正式进入"人机协同"认知革命时代。

2025-08-20 09:10:19 1631

软考论文预习讲义项目管理师

2025-03-28

清华大学deepseek使用教程

2025-02-28

软考高级系统架构设计师：思维导图、经验总结、知识点整理、学习笔记、考前背诵等

2025-02-08

软考系统架构师参考论文

2024-10-16

15 种高级 RAG 技术从预检索到生成

我们关于检索增强生成 (RAG) 的入门文章介绍了关键概念，并探讨了 RAG 系统的工作原理。在本白皮书中，我们探索了 15 种高级 RAG 技术，以提高生成式 AI 系统的输出质量和整体性能的鲁棒性。这些高级 RAG 技术极大地扩展了团队微调系统性能的选择。例如，在为一家大型金融服务公司构建安全的对话式 AI 助手时，我们实验了本白皮书中探讨的大多数高级 RAG 技术。这使我们能够测试并识别适当的优化方案，从预检索到生成，利用我们的自动化 RAG 评估管道。

2024-09-25

huggingface上bge-reranker-base模型文件下载和本地使用

模型使用： from sentence_transformers import SentenceTransformer sentences_1 = ["你是谁"] sentences_2 = ["你是哪个", "你是谁啊","who are you","谁"] model = SentenceTransformer('/Users/hb-mac/Documents/chatGpt/llam/bge-reranker-base') embeddings_1 = model.encode(sentences_1, normalize_embeddings=True) embeddings_2 = model.encode(sentences_2, normalize_embeddings=True) similarity = embeddings_1 @ embeddings_2.T print(similarity)

2024-06-19

llamaindex入门案例代码

注意：（1）python版本：3.11 （2）llamaindex版本：pip3 install llama-index==0.9.34 （3）底层大模型使用默认的chatGpt，需要有chatGpt的api_key （4）本地网络环境需要梯子

2024-02-29

承诺书模板-网站备案信息真实性承诺书.pdf

2023-12-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人