kakaZhui-CSDN博客

原创【读论文】LongEmotion: LLM长文本+情感智能

大型语言模型（LLM）在情感智能（EI）和长文本处理领域取得了显著进展，但在“长文本语境下的情感处理”这一交叉点上，现有的基准测试仍存在空白。真实的心理咨询、情感陪伴场景往往伴随着漫长、复杂且充满噪音的对话流。港大、城市大学等机构联合推出的基准，填补了这一空白。该基准不仅包含六大任务（平均上下文长度达 15k tokens），更提出了框架——一种结合 RAG 与多智能体协作的新架构，旨在解决长文本下的情感推理难题。本文将从问题背景、基准设计、CoEM 框架实现及实验分析四个维度尝试进行拆解。

2026-01-23 13:17:53 9

原创【读论文】Character-R1：角色扮演大模型方案

在 Role-Playing Agents (RPAs) 领域，长期以来存在一个核心痛点：基于 SFT（监督微调）训练的模型只会“模仿”角色的表面台词，却不懂角色的“内心戏”，导致在复杂场景下频频出戏 OOC（Out-of-Character）。哈工大联合百度、腾讯等机构提出的框架，借鉴了认知心理学理论，通过机制和RLVR，强制模型在说话前先进行“角色认知推理”。这不仅让 AI 学会了像角色一样思考，更通过和解决了开放式生成任务中奖励难以设计和优化的难题。

2026-01-22 13:31:35 425

原创【读论文】AI陪伴场景长期记忆（用户画像）解决方案

在长程人机交互中，如何让 AI 记住用户，不再是简单的“检索增强（RAG）”就能解决的问题。传统的向量数据库面临“信息信噪比低”、“人格不一致”以及“随着对话无限增长而崩塌”的困境。MemTensor 团队联合人大提出的Inside Out框架，从认知心理学汲取灵感，提出了一种基于PersonaTree（人格树）的显式记忆进化机制。该方案通过训练一个轻量级的（使用 DeepSeek-R1 蒸馏数据 + GRPO 强化学习），实现了将非结构化对话流实时压缩为结构化树操作（新增|更新|删除）。

2026-01-20 22:59:22 481

原创【读论文】DeepPersona：AI陪伴人设可以升级一下了

在 Agent 模拟、推荐系统和 AI 对齐研究中，高质量的“合成用户（Synthetic Personas）”是核心燃料。然而，当前的合成数据往往陷入“浅薄”与“刻板”的陷阱——GPT 生成的用户画像通常只有寥寥数语，缺乏真实人类的复杂性与矛盾性。提出了一种全新的范式，通过挖掘真实对话构建属性分类树，结合渐进式条件采样，生成了包含数百个层级化属性、文本量达 1MB 的深度人格。本文尝试将从问题背景、核心算法设计、工程实现逻辑及实验效果四个维度，对这一 SOTA 引擎进行硬核拆解。

2026-01-19 13:10:25 467

原创【读代码】从claude skills到superpowers项目

最近claude skills成了大热门，今天一起看下GitHub 上的开源技能框架，他将“工作流”封装为“技能” (Skills)。本文尝试剖析该项目的技能粒度定义、多技能关联架构、应用逻辑等。与传统的 Function Calling 不同，Superpowers 中的 Skill 定义粒度并非“原子操作”，而是**“认知模式” (Cognitive Mode) 或“工作阶段”**。

2026-01-16 13:09:07 178

原创【论文解读】Engram：DeepSeek V4要来了吗？

在 Mixture-of-Experts (MoE) 成功通过“条件计算”解决模型容量与推理成本的矛盾后，DeepSeek-AI 再次抛出重磅炸弹——Engram。论文背景是Transformer 长期以来被迫用昂贵的计算来“模拟”记忆检索。Engram 通过引入**条件记忆（Conditional Memory）**机制，将经典的 N-gram 思想现代化，以O1O(1)O1的查表代价实现了静态知识的极速调用。

2026-01-16 12:39:14 163

原创【论文回顾】24ms延时ASR模型: Nemotron-Speech-Streaming-En-0.6

今天一起看下英伟达推出的低延时ASR模型论文《Stateful Conformer with Cache-based Inference for Streaming Automatic Speech Recognition》，该论文基于FastConformer架构提出了一种高效的流式语音识别模型，通过激活值缓存机制将非自回归编码器转换为自回归推理模式，同时引入混合CTC/RNNT架构实现性能与计算效率的均衡。该论文解决了流式ASR的根本矛盾传统方案缺点论文方案优势实时RNN性能差。

2026-01-11 21:31:28 741

原创阿里新开源Qwen3-VL-Embedding--多模态RAG有救了

随着多模态大模型（LMM）的爆发，传统的文本检索已无法满足图像、视频、可视化文档等复杂数据的搜索需求。最新阿里巴巴通义实验室发布了和系列模型，基于 Qwen3-VL 基座，构建了一套端到端的高精度多模态检索流水线。本文基于官方论文，从架构设计数据合成工程多阶段训练范式以及推理优化四个维度，尝试该系列模型如何通过 Matryoshka 表示学习（MRL）、量化感知训练（QAT）以及 Reranker 蒸馏技术，在 MMEB-v2 等权威榜单上刷新 SOTA。

2026-01-09 15:32:59 1156

原创【读论文】ASR大模型动态热词新方案

大型语言模型（LLMs）以其卓越的通用知识和推理能力重塑了 AI 领域，但它们在处理特定领域或用户的专有词汇（即“热词”）时，往往表现出“选择性失忆”。传统的 RAG 或 Prompting 方案在实时性和准确性上存在瓶颈。阿里的《Hotword Model for Large Models》论文提出了一种“神经插件”方案，它能够在不修改基座模型权重的前提下，动态、精准地将热词能力注入到生成过程中。本文将从架构设计、训练范式到推理逻辑，全方位拆解这一技术的内核，并探讨其在工业级应用中的价值。

2026-01-07 17:43:57 146

原创【Agent实战】Anthropic Skills、MCP与LangGraph的工程实践

随着大语言模型（LLM）应用从简单的Chatbot向自主智能体（Autonomous Agents）演进，如何管理复杂的任务上下文、标准化的工具调用以及确定性的业务流程，成为了系统设计的核心挑战。Anthropic 推出的 Skills 规范，结合 Model Context Protocol (MCP) 与 Function Calling，为构建模块化、可扩展的 Agent 提供了全新的范式。

2026-01-07 17:30:30 146

原创【读代码】Chatterbox 解析：从核心的Llama 架构到流式 Voice AI的工程应用实现

在 TTS（文本转语音）领域，长期存在着“质量、速度、可控性”的三角博弈。Resemble AI 开源的Chatterbox项目，通过将Llama 语言模型架构与Flow Matching（流匹配）结合，并利用一致性蒸馏技术，成功打破了这一僵局。本文将从底层模型设计出发，尝试剖析 Chatterbox 的训练与推理逻辑，将其与 VITS、Tortoise 等主流模型进行对比，并最终通过代码示例展示其在“零延迟”全双工 Voice AI 系统中的实现路径。

2026-01-06 22:31:32 1114

原创【读论文】老爱在假期发论文之DeepSeek mHC

在深度学习的宏观架构设计中，残差连接（Residual Connection）曾是过去十年不可撼动的基石。DeepSeek最新提出的，试图在保留“超连接（Hyper-Connections, HC）”带来的巨大性能增益的同时，通过流形约束（Manifold Constraint）解决其在大规模训练中的不稳定性问题。本文将从数学原理、系统工程优化及代码实现三个维度尝试剖析 mHC 如何重新定义大模型的网路链接。理论层面。

2026-01-04 14:40:00 980

原创【读代码】用 Pathway 重构你的实时RAG应用

在 RAG（检索增强生成）应用从 Demo 走向 Production 的过程中，开发者面临的最大挑战往往不是 Prompt 调优，而是数据管道的工程化：如何保证知识库的毫秒级同步更新？如何处理非结构化数据的复杂 ETL？如何构建带有反馈闭环的自适应系统？本文将深入分析 Pathway 开源项目，探讨其如何通过“流式优先（Streaming First）”的设计哲学，解决传统 LangChain 架构中难以攻克的“数据重力”问题。

2026-01-04 13:16:40 1023

原创实用的翻译大模型之王：腾讯 HY-MT1.5

最近当业界还在卷千亿参数的通用模型时，腾讯混元团队发布了 HY-MT1.5 系列（1.8B 与 7B），专业的机器翻译大模型，而且搞了一套专为机器翻译（MT）打造的全链路训练框架，通过强弱模型在线蒸馏（Strong-to-Weak On-Policy Distillation）与细粒度多维强化学习（Rubrics-based RL），在极小的参数规模下实现了媲美 Gemini-3.0-Pro 的翻译质量。

2026-01-03 22:19:23 1008

原创新出的智谱GLM-4.7很牛逼？

Zhipu AI（智谱）最近发布的 GLM-4.7 再次刷新了开源大模型的天花板。作为一款约 400B 参数规模的 MoE 模型，它不仅在传统的代码与推理任务上超越了 DeepSeek-V3.2 和 Kimi-K2 等强力对手，更通过**“保留思考（Preserved Thinking）”和“交错思考（Interleaved Thinking）”**等架构级创新，重新定义了 Agentic Workflow 的设计范式。

2025-12-29 21:54:54 1282

原创阿里语音交互大模型Fun-Audio-Chat-8B解析

阿里巴巴通义实验室（FunAudio Team）于最近祭出了新的语音交互大模型——，不同于传统级联方案（ASR+LLM+TTS）的拼凑感，也不同于早期 Audio-LLM 的高延迟，Fun-Audio-Chat 通过双分辨率语音表征（DRSR）核心鸡尾酒疗法训练（Core-Cocktail Training）以及多任务 DPO，在 8B 参数规模下实现了低延迟、高情感感知和全双工交互。本文将从架构设计到训练范式，全方位拆解这一“语音版 Qwen”的技术内核。

2025-12-24 22:54:00 869

原创【实战总结】从llm训练到Agent 架构演进再到Agent落地优化

随着大语言模型（LLM）从单纯的“对话者”向具备自主行动能力的“Agent”演进，单一的 Prompt Engineering 已无法满足生产级应用的需求。本文尝试剖析三大主流架构的设计哲学，探讨如何通过将 Agent 能力内化为模型本能，并重点解决工程落地中令人头疼的“过敏性工具调用”（Trigger-Happy）问题，总结一套从算法到工程的完整解决方案。

2025-12-22 22:02:56 230

原创 Meta新开源多语种语音基座Omnilingual ASR

Meta FAIR 团队最近祭出了，这不仅仅是对 MMS (Massively Multilingual Speech) 的简单升级，而是一次从“多任务学习”向“上下文学习（In-Context Learning）”的范式跃迁。通过将 Wav2Vec 2.0 编码器扩展至 70 亿参数，并引入 LLM 风格的 Decoder，Omnilingual ASR 不仅原生支持 1600+ 种语言，更具备了类似 GPT 的“零样本”扩展能力——只需给出几个音频-文本对，即可解锁从未见过的语言。

2025-12-22 12:36:22 63

原创 Fun-ASR的大模型LLM-ASR：强化学习+ASR

在 Whisper 开启了大规模弱监督训练的时代后，ASR（自动语音识别）的下一个高地无疑是与 LLM（大语言模型）的深度融合。然而，LLM 的“幻觉”本性与 ASR 对“精准逐字”的要求存在天然矛盾。阿里的Fun-ASR，提出了一套包含互补性预训练、多阶段 SFT、GRPO 强化学习以及 RAG 热词增强的完整解决方案，不仅在 Open-Source 榜单上有好的表现，更在真实工业场景中优化了流式延迟、噪声干扰和混合语种识别等核心难题。Fun-ASR 不仅仅是又一个刷榜的 ASR 模型，它代表了。

2025-12-20 21:45:39 1075

原创小米新开源 MiMo-V2-Flash：稀疏注意力+强化学习超越DeepSeek-V3.2？

在追求 AGI 的道路上，如何在保持高性能推理能力的同时，极致压缩计算成本与显存占用？小米 LLM-Core 团队最新发布的给出了一个新的角度和方案。这款拥有 309B 参数（激活参数仅 15B）的 MoE 模型，通过混合滑动窗口注意力（Hybrid SWA）轻量级多 Token 预测（MTP）以及多教师在线蒸馏（MOPD），在推理效率和复杂任务处理能力上比肩 DeepSeek-V3.2 等顶尖开源模型。

2025-12-17 21:55:27 1424 1

原创字节新论文：通过Context-Folding记忆折叠实现复杂Agent

今天一起看下字节新出论文《Scaling Long-Horizon LLM Agent via Context-Folding》。在构建长程（Long-Horizon）Agent 时，上下文窗口的线性增长与注意力的二次方开销是制约模型推理能力与运行效率的核心瓶颈。不同于传统的 RAG 或基于摘要的被动压缩，字节提出的Context-Folding 赋予了 Agent主动管理记忆的能力：通过branch和return。

2025-12-16 21:09:36 217

原创解构 OpenAI 的记忆管理机制：从 “Bio Tool“ 到工程化落地

今天一起来读一篇ChatGPT Memory的逆向工程博客（https://manthanguptaa.in/posts/chatgpt_memory）。大语言模型（LLM）的无状态性（Statelessness）一直是构建个性化 Agent 的核心瓶颈，OpenAI 很早在 ChatGPT 中推出的 Memory 功能，标志着从单纯的 RAG（检索增强生成）向“主动式状态管理”的范式转移。本文将基于逆向工程视角，尝试理解ChatGPT 的bio工具机制，探讨其构建长期记忆”的智能体的设计逻辑。

2025-12-16 12:30:55 58

原创深度解析 Max-Min 语义分块策略对 RAG 的重构与优化

在检索增强生成（RAG）系统的构建过程中，文档分块（Chunking）的质量直接决定了检索的精度与生成内容的连贯性。传统的固定长度或基于结构的分割方法，往往因忽略文本内在语义逻辑而导致上下文断裂或噪声引入。今天一起看下论文《Max–Min semantic chunking of documents for RAG application》，看下动态语义分块算法——Max-Min 语义分块，如何作用提升 RAG 性能的底层优化。

2025-12-14 22:21:27 964

原创 Jina AI “Late-Chunking“如何解决RAG的文档分块困境

文档分块（Chunking）是构建检索增强生成（RAG）系统中最基础、也最棘手的一环。长久以来，开发者们一直在“小分块（有利于检索精度）”和“大分块（有利于上下文完整性）”这对根本矛盾中艰难权衡。传统的固定大小、递归字符、甚至语义分块策略，都只是在这一矛盾体上寻找妥协点，未能从根本上解决问题。今天一起看下Jina AI提出的开源项目，它通过将检索单元与生成单元解耦，实现了在检索时精准、在生成时完整的双重目标。

2025-12-13 22:20:56 112

原创【Anthropic分享博客】Anthropic 内部的 Agentic Workflow 工程实践

随着 AI 辅助编程从单纯的 “Chat” 向 “Agentic”（代理式）演进，一直都是代表一种全新的工程交互范式。本文基于 Anthropic 最新分享看Claude Code的落地案例，尝试解析 Claude Code 的技术架构逻辑、上下文管理策略（Context Management）、以及基于 MCP（Model Context Protocol）的扩展应用，并重点分析如何利用这一工具构建“人在回路”的自动化闭环，以及其对现代软件工程生命周期的重构。

2025-12-12 21:33:54 80

原创【读代码】claude-mem: claude code记忆升级

在 AI Engineering 的实践中，Context Window 的限制与 Session 的无状态性一直是构建长程任务 Agent 的核心瓶颈。GitHub 开源项目 claude-mem为 Anthropic 最新的工具提供了一套基于Hook 机制与异步压缩的持久化记忆解决方案。本文将从架构设计、核心工作流、代码实现及工程启示四个维度，深度剖析这个让 AI 拥有“项目连续性”记忆方案。

2025-12-11 13:14:10 863

原创生产级 Agent 的极简架构: MiniMax Mini-Agent

在 Agent 框架百花齐放的今天，一起来看下MiniMax 发布的开源项目Mini-Agent（https://github.com/MiniMax-AI/Mini-Agent)），他提供了一个独特的视角。它不仅仅是自家 M2 模型的展示 Demo，更是一套遵循“Interleaved Thinking”（交错思维）范式的参考架构。本文将从架构设计、核心代码逻辑、Context 管理策略及 MCP 协议集成四个维度，深度剖析这个轻量级但生产力极强的 Agent 框架。

2025-12-10 13:00:21 212

原创【读论文】医疗RAG的精准评测与实战优化

检索增强生成（Retrieval-Augmented Generation, RAG）被普遍认为是解决大型语言模型（LLM）在医疗等高风险领域知识更新滞后、回答缺乏依据等问题的关键技术，RAG总能带来性能提升已经被广泛默认，但是最近看到一篇论文（Kim et al., arXiv:2511.06738v1）对此有质疑。论文发现，医学领域中标准的RAG流程不仅未能稳定提升性能，在许多情况下甚至会降低答案的事实性和完整性。相比结论，我更感兴趣的是论文的评测方法和优化方案，作者们设计了三阶段精细化评测框架。

2025-12-07 22:00:29 60

原创语音停顿检测模型Smart Turn V3：延时12ms？

在实时语音对话系统（Real-time Conversational AI）中，端点检测（Endpointing）始终是影响用户体验的核心痛点。传统的基于信号能量的 VAD（Voice Activity Detection）方案陷入了“延迟与打断”的零和博弈：阈值设置过短会导致频繁打断用户的思考（False Positive），设置过长则会导致系统响应迟钝（High Latency）。Pipecat AI 近期开源的模型提出了一种**音频原生（Audio-Native）**的解决方案。

2025-12-06 23:48:35 112

原创 DeepSeek新开源V3.2-Exp：稀疏注意力机制如何重塑长上下文推理效率

DeepSeek-AI 最新发布的 DeepSeek-V3.2-Exp 通过引入。

2025-12-02 21:55:39 901

原创【读代码】构建有状态的智能体：从MemGPT架构分析到 LangGraph实践

这是最关键的一步。我们需要将从常规的消息流中剥离出来，使其成为一个独立的、持久的状态对象。# 定义核心内存结构persona: str # 机器人的自我设定human: str # 机器人对用户的认知# 定义 Agent 全局状态# 消息历史：使用 operator.add 实现追加模式# 核心内存：不使用 add，而是由 ToolNode 进行全量替换/更新# 这模拟了 RAM 的读写特性传统的工具是 Read-only 的（如搜索 Google）。

2025-12-01 22:45:47 208

原创【读代码】RAG Agent专属内存管理方案MIRIX

最近关注到RAG Agent内存管理项目MIRIX（https://github.com/Mirix-AI/MIRIX），它提出了一种基于多智能体协作（Multi-Agent Collaboration）和认知科学模型的六层记忆架构。本文尝试从系统架构、记忆ETL流水线、主动检索机制及代码实现四个维度，深度剖析 MIRIX 如何解决智能体“灾难性遗忘”与“信息碎片化”的核心难题。

2025-12-01 22:20:09 500

原创【读代码】微软RAG内存管理方案：Microsoft Kernel Memory

在 AI 工程化落地过程中，RAG的瓶颈往往不在于模型本身，而在于数据处理流水线的健壮性。如何高效处理 PDF/Word/网页等多模态数据？如何解决文档切片的语义断裂？如何处理大规模文档索引时的延迟与重试？给出了企业级的方案。它不是一个简单的向量库连接器，而是一个云原生的、异步的、支持多模态的 AI 服务。KM 的强大之处在于其可扩展性。假设你需要处理一种特殊的专有格式文件.xyz，或者你想在写入向量库之前对文本进行脱敏处理 (PII Redaction)。

2025-11-30 23:18:36 98

原创【读代码】Zep--基于Graph-RAG的记忆方案

在构建生产级 AI Agent 时，开发者面临着一个普遍的困境：简单的向量检索（Vector RAG）无法处理复杂的关系推理，而庞大的上下文窗口（Context Window）又带来了昂贵的成本和延迟。作为一种"记忆即服务"（Memory-as-a-Service）的基础设施，它不仅仅是一个向量数据库，更是一个集成了异步 NLP 流水线时序知识图谱 (Temporal Knowledge Graph)和混合检索的完整记忆操作系统。

2025-11-28 23:39:58 94

原创【Agent实战】从 Anthropic 多智能体实践总结到类OpenManus应用实现（资源中附完整代码）

近期关注Anthropic 分享的其内部用于复杂任务处理的“多智能体研究系统”（https://www.anthropic.com/engineering/multi-agent-research-system），通过并行化、分工化和迭代式的设计，显著提升了 LLM 解决复杂问题的广度与深度。本文将尝试分析Anthropic 的架构理念，并以之前爆火的Manus为产品对标，使用 Python 和LangGraph框架，从零构建一个具备中文意图理解、英文广度搜索、深度中文报告生成。

2025-11-27 21:52:41 80

原创【实战总结】Agent 应用中的高级记忆管理方案思考

在从早期的 Chatbot 向自主 Agent（Autonomous Agent）演进的过程中，"记忆（Memory）"的定义发生了质的改变。对于工业级 Agent 而言，记忆不再仅仅是滑动窗口内的几轮对话历史，而是一套涵盖了显性工作状态隐性用户画像以及语义知识沉淀的复杂代谢系统。本文将深入探讨工业界在构建 Agent 记忆系统时面临的核心挑战，尝试一种基于“双轨制记忆代谢（Dual-Track Memory Metabolism）”的通用架构，并基于LangGraph和Vector DB。

2025-11-27 21:14:42 72

原创具备强推理能力的1.5B大模型，来自新浪的VibeThinker

当前“模型越大，能力越强”成为行业共识，但是也有例外，今天一起看下新浪微博AI团队发布的VibeThinker-1.5B模型，以仅15亿的参数量，在多个高难度数学和代码基准测试中，其性能不仅媲美甚至超越了体量数百倍于它的巨型模型（如DeepSeek R1 671B）。这背后并非简单的调参或数据堆砌，而是一套名为“频谱-信号原理”（Spectrum-to-Signal Principle, SSP）的创新后训练（Post-training）的独特设计。

2025-11-26 22:53:08 131

原创低成本AI 硬件解决方案：Xiaozhi-ESP32 全链路架构

随着大语言模型 (LLM) 的爆发，如何将强大的认知能力下沉到低成本、低功耗的 IoT 设备上，成为 AIoT 领域的核心命题。开源项目提供了一个不错的解决方案。该项目采用“瘦客户端 + 胖服务端” (Thin Client + Thick Server)的架构设计，基于 ESP32 芯片实现了具备全双工语音交互、多轮对话记忆、多模态情感表达及视觉感知能力的 AI 智能体。本文将从系统架构、关键算法实现、工程优化策略三个维度，深度剖析该项目的技术内核。

2025-11-26 22:15:22 530

原创【读代码】Agent内存管理：Memori内存引擎框架

Memori （https://github.com/GibsonAI/Memori）是一个创新的开源SQL原生内存引擎，专为AI代理和多智能体系统设计。通过独特的双模式内存架构（Conscious Ingest 与 Auto Ingest）和智能上下文注入机制，Memori 实现了90%的成本节省（相比向量数据库）。

2025-11-20 00:00:39 871

原创能够落地的Agent应该长成什么样子【完整代码见资源下载】

以DeepResearch为例，如何才能构建一个强大、稳定且可扩展的商用应用，如何使用LangGraph库来编排一个循环、有状态的工作流。并且，这些难点要怎么解决呢模糊指令下如何通过多轮追问明确需求长短记忆如何分别管理子任务失败如何回溯LLM API 限流和报错如何处理如何防护恶意指令的攻击工具调用如何监控和优化效率。

2025-11-18 14:22:41 586

从 Anthropic 多智能体实践总结到类OpenManus应用实现

2025-12-01

如何构建一个具备多轮追问、子任务失败回溯、恶意指令防护及API限流处理能力的DeepResearch Agent？

2025-11-18

客服中心+RAG对话+大模型agent

客服对话RAG的完整实践方案

2025-10-02

专栏附带练习题与参考答案-零基础上手Python数据分析

专栏见https://blog.csdn.net/kakazhui/category_12913949.html，帮助数据分析初学者迅速入门并上手

2025-05-12

谷歌大模型prompt编写指南

内容概要：本文详细介绍了提示工程的核心概念和技术，旨在帮助读者理解和掌握如何编写高质量的提示以引导大型语言模型（LLM）生成准确、有用的输出。文章首先解释了提示工程的基础知识，包括LLM的工作原理、输出配置（如温度、top-K、top-P）以及如何选择合适的模型配置。接着，文章深入探讨了多种提示技巧，如零样本提示、少量样本提示、系统提示、情境提示、角色提示、后退提示、思路链（CoT）、自洽性提示和思路之树（ToT）。此外，还介绍了如何通过ReAct方法结合推理和行动来解决复杂任务。最后，文章讨论了自动提示工程的应用，并分享了提示工程的最佳实践，如记录提示尝试、使用变量、控制输出格式等。适合人群：对大型语言模型有一定了解并希望深入学习如何编写高效提示的开发者、研究人员和工程师。使用场景及目标：①帮助用户理解提示工程的基础知识和核心技术；②指导用户根据具体应用场景选择合适的提示技巧；③提高用户编写高质量提示的能力，从而优化LLM的输出质量。其他说明：本文提供了大量的实例和代码片段，便于读者实践和理解。同时，文章强调了提示工程的迭代性质，鼓励读者不断尝试和优化提示，以适应不同的任务需求和模型版本。此外，文中还提及了多个参考资料和工具，如Google Cloud的Vertex AI Studio，以支持读者进一步探索和应用提示工程技术。

2025-05-07

基于python从0到1实现一个plan-execute方案的Agent（快速学习原理和实现）

2025-04-25

基于python从0到1实现reAct Agent

2025-04-25

算法面试2025中国移动算法面试编程题目及参考答案：1）服务器集群通信统计，2）整数1出现次数计算

内容概要：本文档提供了两道编程题目及其要求。第一题是关于服务器集群通信问题，第二题是计算从1到n的所有整数中数字1出现的总次数。

2025-04-16

pyhton脚本如何轻松实现html转换pdf，轻松生成分析报告

2025-04-13

如何基于大模型（DeepSeek）实现一个多智能体的对话系统的，python脚本

2025-02-24

python脚本：利用openai接口模拟相声对话，AI郭老师和于老师已上线（DeepSeek接口也通用）

AI郭: 哎呀，说起看电影啊，我可太有发言权了！前两天我去电影院，那叫一个热闹！你知道我买票的时候发生啥事儿了吗？那售票员问我：“先生，您要买什么票？”我说：“我要看《流浪地球》。”结果您猜怎么着？那售票员一脸懵，说：“先生，我们这儿只有《流浪月球》。”我一听，乐了，说：“哟，这地球都流浪到月球去了？” AI于: 啊？还有这事儿？《流浪月球》？那地球去哪儿了？ AI郭: 可不是嘛！我琢磨着，这地球是不是嫌月球太孤单，干脆陪它一起流浪去了？结果您猜怎么着？那售票员一脸严肃地说：“先生，您误会了，这是《流浪月球》，讲的是月球离家出走的故事。”我一听，差点儿笑喷了，说：“哎哟，这月球也学会叛逆了？地球它妈知道吗？” AI于: 哎呦喂！这月球还学会离家出走了？那地球不得急死啊！ AI郭: 可不是嘛！我寻思着，这地球要是知道了，不得满宇宙找孩子去？结果您猜怎么着？那售票员还一本正经地跟我解释：“先生，您别担心，月球离家出走是因为地球太唠叨了，整天念叨‘你咋还不转呢？’‘你咋还不亮呢？’月球受不了了，干脆一走了之。”我一听，乐得直拍大腿，说：“哎哟，这地球还是个碎嘴子呢！”

2025-02-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

从 Anthropic 多智能体实践总结到类OpenManus应用实现

如何构建一个具备多轮追问、子任务失败回溯、恶意指令防护及API限流处理能力的DeepResearch Agent？

客服中心+RAG对话+大模型agent

专栏附带练习题与参考答案-零基础上手Python数据分析

谷歌大模型prompt编写指南

基于python从0到1实现一个plan-execute方案的Agent（快速学习原理和实现）

基于python从0到1实现reAct Agent

算法面试2025中国移动算法面试编程题目及参考答案：1）服务器集群通信统计，2）整数1出现次数计算

pyhton脚本如何轻松实现html转换pdf，轻松生成分析报告

如何基于大模型（DeepSeek）实现一个多智能体的对话系统的，python脚本

python脚本：利用openai接口模拟相声对话，AI郭老师和于老师已上线（DeepSeek接口也通用）

RAG优化：向量模型（以BGE模型为例）蒸馏，量化，到处onnx模型

python语言入门项目案例（包含代码），学生成绩统计，帮助小白入门

本资源是学生成绩统计案例，涵盖了C语言入门阶段的核心知识点 通过代码实现、详细分析和教学扩展，可以帮助初学者逐步掌握C语言编程的基础

DeepSeek模型本地部署指南：Windows与macOS环境下DeepSeek R1模型的快速安装与使用

包含DeepSeekR1的论文以及清华版的入门进阶文档

python脚本利用deepseek一键创作抖音文案（结合实时更新的百度热搜）

印尼语文本预料，维基百科，文本30k

微软平台的openai接口使用指南

如何成为一个语音识别算法工程师

空空如也

本资源是学生成绩统计案例，涵盖了C语言入门阶段的核心知识点通过代码实现、详细分析和教学扩展，可以帮助初学者逐步掌握C语言编程的基础