- 博客(925)
- 资源 (3)
- 收藏
- 关注
原创 AI大模型推理并行策略:DP、TP、PP、SP、EP的基本原理
摘要:本文介绍了大模型推理部署中常用的并行策略,包括数据并行(DP)、张量并行(TP)、序列并行(SP)、流水线并行(PP)和专家并行(EP)。DP通过多副本处理并发请求,TP拆分模型层到不同GPU,SP处理长序列切分,PP用于显存不足时的层间流水处理,EP则专为MoE模型设计。文章还对比了CP与SP的区别,并提及Ulysses并行的数据交换机制。实际应用中需根据模型规模、硬件配置等综合选择合适的并行策略组合。这些方法能有效解决显存不足和计算效率问题,提升大模型推理性能。
2026-05-21 16:42:46
204
原创 13个 AI Agent 的基础概念
本文系统介绍了AI Agent及相关技术概念:1)AI Agent基于大语言模型,具备任务规划、记忆存储和工具调用能力,可自主完成复杂任务;2)大模型训练分为预训练(基础语言能力)和微调(场景适配)两个阶段;3)关键技术包括处理模型幻觉、MCP协议(外部资源对接)、Token分词机制、RAG检索增强等;4)Agent具备短期/长期记忆模块、Skill技能库和ReAct决策机制,支持自我反思优化;5)配套工程体系涵盖Harness工程(运行环境搭建)和SDD规格驱动开发(需求规范化)。这些技术共同构成了AI
2026-05-21 16:04:18
81
原创 Claude Code 上下文管理机制深度拆解:超长 Agent 任务如何不崩盘
企业级AI编码助手面临的核心挑战在于上下文管理:如何在有限的计算资源内高效处理复杂的项目需求、代码库和交互历史。文章揭示了ClaudeCode的上下文管理机制,包括七类分层缓存、预算预警系统、按需加载规则和五级卸载策略。关键创新点包括:动态文件缓存、会话记忆摘要、多级压缩机制以及应急处理方案。这些机制共同解决了长任务执行中的信息过载问题,确保AI在正确时间获取正确信息,同时为开发者提供了构建复杂Agent的重要参考——强调分层管理、预算预留、工具结果分级处理和上下文重建能力。
2026-05-20 16:33:11
392
原创 从Prompt、Context到Harness,工程的三次进化
AI工程的三次进化:从提示词到系统驾驭 本文揭示了AI工程领域的三次关键进化:Prompt Engineering解决如何与AI沟通的问题,Context Engineering确保AI获取正确的上下文信息,Harness Engineering则构建可靠的系统约束机制。OpenAI的实验表明,通过精心设计的Harness系统,3-7人团队能在5个月内让AI生成近百万行生产级代码。随着模型能力提升,Harness会逐渐简化,但当前阶段仍是确保AI可靠运行的关键。工程师的角色正从"写代码"
2026-05-20 16:28:13
382
原创 从“外挂”到“脑子”:LLM Agent的进化逻辑
摘要:本文综述了大模型Agent的"外化"(Externalization)演进框架,提出智能系统的核心进化在于将认知负担从模型内部转移到外部设施。研究将发展分为三个阶段:能力内嵌于权重、转移到上下文、最终外化为记忆库、技能文件和协议层。论文系统分析了外化的三个维度:记忆管理(分层存储与检索)、技能封装(可复用流程)和协议标准化(交互规范),并阐述了整合三者的Harness层的关键作用。研究指出,未来方向包括具身智能的模块化分工、自进化基础设施和共享生态建设,强调Agent系统的可靠性更
2026-05-19 11:23:27
234
原创 AI大模型对话的本质、Token、上下文窗口以及模型评估方法
《大模型Token计费指南:原理、成本与选型策略》 本文深入解析了大模型Token计费机制及其应用策略。Token作为大模型处理文本的基本单位,直接影响使用成本、模型选型和交互体验。文章从四个方面展开:1)对话本质是单向请求-响应过程,模型不保留记忆;2)上下文窗口决定模型临时记忆容量,不同产品采用分级压缩策略管理;3)计费按输入输出Token分开计算,输出成本通常是输入的3-5倍;4)提供Prompt缓存、批量API等实用省钱技巧,并对比Claude、GPT等主流模型的优劣势。最后强调模型选择应匹配具体场
2026-05-19 11:21:27
432
原创 AI开发者需要掌握的9种RAG架构
每个 AI 开发者都得了解的 9 种 RAG 架构,跳出基础 RAG 的局限,搭建靠谱的生产级 AI 系统。最好的 RAG 系统,不是最复杂的那个,而是在你的约束条件内,能可靠服务用户的那个。建议从简单的标准 RAG 开始,做好评估,衡量每一个指标,只有在有明确证据表明需要时,再增加复杂度。先把基础打牢,比盲目追求复杂架构更重要。
2026-05-19 11:17:23
451
原创 AI Agent Skill 从入门到精通:定义、结构、调用链路与底层原理
摘要: 本文系统讲解了如何从零开发生产级AI Agent Skill,涵盖Skill的定义、核心结构、设计原则及实战案例。Skill不同于普通函数,关键在于结构化描述(description、trigger rules等),使LLM能准确调用。文章详细拆解了Skill的7个核心模块(名称、描述、触发规则、参数槽位、执行逻辑、返回格式、权限控制),并通过3个实战案例(商品价格查询、折扣计算、数据库查询)演示开发流程。此外,深入探讨了Skill注册机制、调度引擎、多轮对话设计及异常处理策略,帮助开发者避开80%
2026-05-18 09:42:33
211
原创 LangGraph Hierarchical 模式:为什么你的组织层级任务总是卡在中间层?
摘要:Hierarchical模式的核心在于任务分解与动态下派,而非简单的层层审批。该架构通过CEO-VP-Manager-Engineer的层级结构实现任务分解、状态管理和异常处理,每个层级承担不同职责。生产级应用需重点关注任务分配、结果聚合和异常处理机制,避免任务卡顿和结果丢失问题。相比单一Agent方案,Hierarchical模式通过多级协作提升系统的可扩展性和可维护性,适用于需要并行处理的复杂任务场景。
2026-05-18 09:38:32
181
原创 Prefill、Decode 与 KV Cache详细介绍
摘要:大语言模型推理延迟分为Prefill和Decode两个阶段,分别受算力和内存带宽限制。Prefill阶段处理完整输入生成首个字符,依赖显卡算力;Decode阶段逐个生成后续字符,受显存带宽和KV缓存影响。KV缓存可提升长文本生成效率但占用显存,需通过量化、分页等优化手段控制资源消耗。模型量化能减少显存占用但会损失精度,需权衡效果与性能。实际优化需区分首字符延迟(TTFT)和字符间隔(ITL),针对性地精简输入、优化缓存或提升带宽。上下文扩展会显著增加计算和缓存开销,需配套优化策略。完整的问题排查流程应
2026-05-18 09:36:35
366
原创 Anthropic官方12个生产级Agent MCP设计模式
Anthropic 官方最近有一篇关于 MCP 的文章,标题是《Building agents that reach production systems with MCP》,讲的就是这个问题。文章里对比了直接 API 调用、CLI 和 MCP 这三种方式的区别,还解释了为什么现在生产级 Agent 越来越倾向于用 MCP。
2026-05-15 10:16:51
212
原创 视觉 Transformer 的演进之路:从 CNN 进化到 VIT
本文对比分析了卷积神经网络(CNN)和视觉Transformer(ViT)在计算机视觉领域的核心架构与性能差异。CNN通过局部卷积核和分层特征提取实现高效图像处理,但难以捕捉全局特征;ViT则借鉴NLP中的Transformer架构,将图像分割为补丁并利用自注意力机制实现全局特征学习。文章详细解析了两者的工作原理,并通过汽车零部件分类的实战案例展示了ViT的优势:更强的全局特征捕捉能力和迁移性,但也指出其计算成本高、数据依赖大的短板。最后建议根据任务需求选择模型:CNN适合小数据量和局部特征任务,ViT则在
2026-05-15 10:11:39
327
原创 渐渐被 AI 淘汰的 5 类程序员,这里面有你吗?
AI正在重塑程序员的工作方式,传统编码岗位面临严峻挑战。文章指出5类最易被AI取代的程序员:CRUD翻译工、复制粘贴侠、技术保守派、业务盲人和执行机器。同时提出4大转型策略:从编码转向架构评审、深耕行业领域知识、掌握AI工具链、培养产品思维。作者强调,未来程序员的核心竞争力在于"指挥AI的能力"而非编码速度,建议从业者尽快升级为"解决方案专家",才能在AI时代保持不可替代性。
2026-05-14 09:54:28
587
原创 AI Agent开发15大核心概念,建议收藏!
这篇文章主要梳理了AI Agent开发过程中可能会用到的一些概念,还会给每个概念做详细解释,帮那些从其他方向转型做AI Agent开发的开发者和团队,把对这些概念的理解统一起来,沟通的时候也能有一致的语言,减少不必要的误解,降低沟通成本。里面主要包含LLM、Chat bot、Agent等15个核心概念的说明。
2026-05-14 09:41:45
35
原创 华为和信通院发了一份AI安全报告
《2026行业数智化AI安全实践研究报告》揭示AI安全治理新挑战。报告指出,企业在AI落地过程中普遍存在"重传统安全、轻AI特有风险"的结构性矛盾,如算法偏见、模型投毒等问题。报告将风险划分为管理、技术、场景三个层面,提出"IDMAO"全生命周期治理框架,并给出金融、政务、医疗、制造四大行业的实践案例。报告强调AI安全需要系统性解决方案,建议短期建立"上线安全闸口",长期探索"以模治模"的AI免疫系统。
2026-05-13 11:17:04
215
原创 超长 Agent 任务如何不崩盘:Claude Code 上下文管理机制深度拆解
《企业级AI编码助手的上下文管理机制探析》 本文揭示了ClaudeCode等企业级AI编码助手在复杂开发场景中管理上下文的核心机制。面对项目代码、需求文档、工具调用等多源信息,系统通过七层上下文分层管理实现高效运作:1)按作用域加载规则文件;2)LRU缓存实现文件变更感知;3)大工具结果自动落盘;4)轻量级microcompact清理;5)sessionmemory滚动摘要;6)全量autocompact重建工作现场;7)reactivecompact应急处理。系统采用动态预算管理,在147K tokens
2026-05-13 10:34:24
134
原创 什么是Token?你真的懂吗?
《Token:大模型处理信息的基本单位》摘要:Token是AI模型处理各类信息时的基础计算单元,其形态随数据类型和处理需求而变化。在自然语言中,Token可能是字、词或标点;在基因组学中表现为碱基或k-mer片段;蛋白质组学里对应氨基酸或功能域;图像处理时转为视觉patch;语音识别则映射为时间帧或音素。不同于人类理解的完整语义单元,Token是模型将复杂信息分解后的计算颗粒,其切分方式直接影响模型处理效果。理解Token的多样性(从DNA碱基到图像方块)是掌握AI工作原理的重要基础。
2026-05-13 10:31:57
439
原创 Namespace 为什么不够用了:容器逃逸的技术原理与真实攻击链
摘要: 容器逃逸漏洞暴露了共享内核架构的致命缺陷。Namespace 和 cgroups 仅提供资源视图隔离,无法阻止内核级攻击。本文分析三类真实漏洞: 内核漏洞逃逸(如 Dirty COW、CVE-2022-0185):容器内触发内核提权漏洞(如内存竞争、堆溢出),直接穿透 Namespace 获取宿主机 root 权限。 运行时漏洞逃逸(如 CVE-2019-5736):利用 runc 文件描述符泄漏覆盖宿主机二进制文件,或通过恶意镜像(如篡改 WORKDIR)读写宿主机文件系统。 符号链接逃逸(202
2026-05-12 15:05:23
1099
原创 PaaS 平台 CI 能力扩展可行性分析及平台价值描述
本文分析了PaaS平台扩展持续集成(CI)能力的可行性及价值。技术层面,通过引入云原生构建引擎可实现代码到镜像的自动化构建,技术选型成熟且与现有平台兼容。安全方面可复用沙箱隔离技术保障构建安全。实施计划分三阶段4个月完成,最终形成覆盖CI/CD全生命周期的应用管理平台。扩展后的平台具备多语言支持、安全左移、构建加速等核心能力,提供企业级应用交付解决方案,对标商业产品价值,支撑100万元报价。该升级将显著提升研发效能并降低安全风险。
2026-05-12 10:44:15
313
原创 4个问题 + 1个Demo:Agent2Agent(A2A)
谷歌推出A2A协议实现AI智能体间标准化协作 摘要:谷歌最新推出的A2A(Agent2Agent)协议旨在解决不同AI智能体间的互操作问题。该协议通过标准化通信机制(JSON-RPC2.0与HTTP)、安全验证等组件,使异构智能体能够高效协作。A2A架构包含AgentCard(能力描述)、A2AServer(服务入口)和A2AClient(调用端)三个核心组件,支持流式处理、多轮对话和异步任务等复杂场景。与MCP协议(解决智能体与工具集成)不同,A2A专注于智能体间的高层次协作。演示案例展示了搜索智能体通过
2026-05-11 09:43:25
499
原创 拆解、对比与优化:LLM工具智能体的五种任务规划与执行模式
摘要:本文探讨了AI智能体的五种任务规划与执行模式:1)ReAct模式通过思考-行动交替实现动态规划;2)Plan-and-Execute模式先规划后执行;3)静态Workflow采用预设流程;4)混合模式结合静态流程与局部智能;5)分层规划通过高层与低层智能体协作。每种模式各有优劣,适用于不同场景。文章还提出了工具标注增强、案例增强等优化方法,建议根据业务需求灵活选择或组合使用这些模式,以提升智能体的任务执行效率与可靠性。(149字)
2026-05-11 09:39:58
596
原创 Agentic RAG的前世今生
摘要: AgenticRAG是融合智能体(Agent)自主推理能力的检索增强生成(RAG)技术,旨在解决传统RAG在复杂查询任务中的局限性。传统RAG依赖单一检索流程,而AgenticRAG通过动态规划检索策略、多数据源融合、工具调用及自我反思等能力,适应多样化需求(如多步骤查询、跨系统数据整合)。其架构分为单Agent(协调工具)和多Agent(分层协作)两种形式,显著提升检索灵活性与准确性,但也面临延迟和不确定性等挑战。AgenticRAG标志着RAG向更智能、任务导向的演进。
2026-05-11 09:35:25
325
原创 什么是 OpenClaw?
OpenClaw 原名 Clawdbot,是一款可运行在个人环境中的高权限 AI 智能体,支持通过 WhatsApp、飞书、Telegram 等常用聊天软件交互,能实现邮件发送、日程管理、数据查询等自动化任务,且数据隐私自主可控,搭配腾讯云 Lighthouse 可实现 7*24 小时无间断运行(下文为适配操作场景,部分环节仍沿用"Clawdbot"表述,均指代同一产品OpenClaw)。
2026-05-09 10:23:14
530
原创 Agent = Model + Harness! Harness 的设计与未来!
本文探讨了Harness工程在构建智能体(Agent)系统中的核心作用。文章指出,Agent由模型(Model)和Harness两部分组成,其中Harness指所有不属于模型本身的代码、配置和执行逻辑。Harness工程通过提供状态管理、工具调用、反馈循环等能力,将裸模型转化为可实际工作的Agent。文章详细分析了Harness的关键组件,包括文件系统实现持久存储、Bash和代码执行作为通用工具、沙箱环境确保安全执行、记忆与搜索实现持续学习等。同时讨论了Harness如何解决上下文退化(ContextRot
2026-05-09 10:18:02
320
原创 AI Agent 沙箱的实现机制深度解析
沙箱技术通过三层架构实现硬件级隔离与极速启动:1. Linux Namespace进程伪装提供基础隔离;2. gVisor系统调用拦截增强安全性;3. MicroVM硬件虚拟化结合内存快照技术,将冷启动时间压缩至60毫秒,内存开销低于5MB。该方案采用预分配资源池、快照模板克隆和写时复制内存共享技术,突破传统虚拟化性能瓶颈,实现比容器更安全、比虚拟机更快的特性。网络层面通过eBPF实现内核态虚拟化,配合五层纵深防御体系,为AI代码执行等场景提供高安全隔离环境。
2026-05-09 10:13:24
516
原创 DeepSeek终于能看懂图了:这次不只是识图,而是让模型学会“边指边想”
识图模式目前还是灰度,不是全量发布。媒体实测也显示,基础画面描述、文字读取、常见物体理解表现不错,但遇到隐藏图形、碎块化反色图、复杂数量统计、图形逻辑题时仍会出错。比如有测试中,老虎数量题正确答案为 10,只回答成 7;隐藏数字类图片也没有识别出来。这说明它现在更像是 “可用的视觉理解入口 + 研究型视觉推理机制”,还不是一个稳定碾压 GPT、Claude、Gemini 的全能多模态模型。另外,官方 GitHub 也写得比较谨慎:目前发布的是技术报告,未来计划开放内部 benchmark 和一部分
2026-05-08 14:12:37
597
原创 AI网关技术深度解析
AI网关正从“概念”走向“必备基建”。无论是选择功能全面的APISIX系方案,还是轻量高效的LiteLLM,核心都在于理解自身业务对模型多样性、成本敏感度、安全合规和技术栈匹配度的需求。当模型即服务(MaaS)逐渐成为常态,AI网关将承担起连接、保护、优化和治理的关键角色。希望本文对两大主流方案的剖析,能帮助您找到最适合的架构演进路径。
2026-05-08 14:01:40
504
原创 AI Infra 其实没有多少新东西
本文分享了AI基础设施(AIInfra)领域的实践经验与技术挑战。文章首先分析了从CPU为中心到GPU为中心的硬件革命,指出GPU已成为大模型计算的核心,并探讨了"AI大型机"集中式架构的必然性。在软件层面,介绍了PyTorch深度学习框架、GPU编程和Python语言在AI开发中的核心地位。针对模型训练,重点讨论了"存得下"(模型并行)和"算得快"(通信计算重叠)两大挑战。在模型推理方面,提出了降低延迟(CUDAGraph、KVCache)和提高
2026-05-08 13:40:42
377
原创 Linux内核“Copy Fail”漏洞深度解析:从零拷贝优化到稳定提权的技术全貌
Linux内核高危漏洞CVE-2026-31431(代号Copy Fail)被披露,该漏洞存在于内核加密子系统的零拷贝优化中,允许普通用户稳定提权至root。漏洞源于AF_ALG套接字与authencesn算法组合时,通过splice零拷贝机制可导致4字节越界写入,直接篡改目标文件页缓存。攻击者可利用此漏洞修改setuid程序内存内容,实现隐蔽提权且不留磁盘痕迹。影响主流Linux发行版,建议立即升级内核或临时禁用algif_aead模块。该漏洞揭示了零拷贝技术与安全边界验证不足带来的风险。(150字)
2026-05-07 14:17:08
611
原创 Skills 库干掉 60% 手工测试:测试团队效率跃迁的底层逻辑与实战路径
测试团队大量工时正被编写与维护用例、脚本、数据和日志分析等重复性工作消耗,而一套由“需求转用例、API 脚本生成、测试数据合成、失败日志诊断、UI 自动自愈”五类能力组成的 AI Skills 库,正在成为提升效率的关键方法。它并非简单的 Prompt 或脚本集合,而是可组合、可评估、可持续演进的能力体系;若设计和落地得当,测试团队在 12 个月内实现 50%—60% 的效率提升具有现实可行性。
2026-05-07 14:03:22
549
原创 从 DevOps 到 Dev+SkillsOps:研发模式升级
前段时间,一个做了八年 DevOps 平台的朋友跟我吃饭,聊到他们最近在做的事情。 他说:"我们把 CI/CD 做得很顺了,流水线一键跑,部署自动化,监控告警全覆盖。但有个问题我一直没想明白——为什么每次大版本发布,我们还是会出那么多低级错误?" 我问他:那些错误是什么类型的? 他说大部分都是"本来应该被测到的"——边界没覆盖、兼容性没验证、历史坑没规避。不是流程出了问题,是知识没有流动起来...
2026-05-07 13:54:42
577
原创 使用 Claude Code 生产可持久化内容:HarmonyOS Snapshot 内存泄漏分析实践(THS)
本文记录了一次使用 Claude Code Opus 辅助分析 HarmonyOS Snapshot 内存泄漏的工程实践。与单次问答式分析不同,本文关注的是如何把分析过程中形成的资料、脚本、方法论和报告模板沉淀为可复用资产,使后续同类问题可以从已有知识和工具链继续推进。文章以分时页内存上涨问题为背景,介绍从资料准备、Skill 固化、脚本工具链建设,到自动化分析、人工复核和交叉验证的完整流程,并通过一个脚本分析的泄漏案例说明该方法在真实问题中的定位效果。
2026-05-06 09:45:04
392
原创 Transformer原理大白话讲解
《图解Transformer:AI黄金时代的核心引擎》 这篇文章用生活化比喻解析了Transformer的工作原理。Transformer由编码器和解码器组成,编码器像语文老师逐层理解句子,解码器像作家根据理解生成翻译。其核心是自注意力机制,让模型在处理每个词时都能关注句子其他部分,通过Q/K/V矩阵计算词间关系。文章还解释了位置编码、残差连接等关键技术,以及Transformer并行计算的优越性。正是这套机制支撑了ChatGPT等现代AI系统,成为自然语言处理的基石。
2026-05-06 09:38:21
656
原创 读完 Claude Code 源码才发现:Skills、MCP、Rules 的区别,远没有你想的那么大
通过对Claude Code源码的分析,揭示了Rules、MCP、Skills三个概念的底层实现机制。Rules是项目级行为规范,通过messages被动注入;MCP是标准化工具协议,在system和tools中注册并调用外部服务;Skills是可复用提示词,通过tool_use触发后注入指令文本。三者的核心区别在于信息在API请求中的位置不同,而非功能本质...
2026-05-06 09:28:40
417
原创 Claude Code 全攻略:命令大全 + 实战工作流
本文详细介绍了ClaudeCode终端AI助手的使用方法,包含四个核心部分:1)常用命令如版本查看、项目启动和更新;2)三种工作模式(默认、自动接受、计划)的切换及界面说明;3)指令速查表,涵盖初始化、压缩对话、清除历史等操作;4)关键命令详解,包括/init初始化项目、/help查看帮助、/clear重置会话等。文章通过界面截图和场景示例,指导开发者如何高效使用命令行和交互功能,特别强调了PlanMode规划与Auto-Accept执行的配合使用,以及通过/memory管理项目知识库的最佳实践。
2026-04-30 10:44:57
289
原创 从 Demo 到生产:NVIDIA RAG 部署课程学习与 Mirror 实践启发(THS)
本文基于 NVIDIA Deep Learning Institute 的《在生产环境大规模部署 RAG 工作流》课程,围绕 NIM、RAG、K8s/Helm/Operator、监控弹性、多模态与 Agentic AI 等主线,从工程实践角度总结课程内容,并结合 Mirror 平台的实际场景提供启发。
2026-04-30 10:40:39
393
原创 vLLM 硬核四连发
vLLM在2026年3月推出四大核心更新:1)SemanticRouter v0.2 Athena升级为多模型编排系统;2)Nemotron3 Super MoE模型优化多智能体协作;3)P-EAGLE实现并行推测解码突破性能瓶颈;4)ModelRunner V2重构底层引擎提升56%吞吐量。这些更新从推理加速、多模型调度到智能体操作系统全面升级,推动vLLM从单一推理引擎向AI推理平台转型。其中P-EAGLE通过单次前向传播生成所有草稿token,Nemotron3 Super则凭借120B参数/12B激
2026-04-29 11:00:42
683
原创 从 CUDA 到 ROCm:AMD 云端 AI 开发的全栈迁移与性能优化实践
摘要: AMD ROCm平台作为开源GPU计算解决方案,在AI训练与推理领域快速发展。本文系统解析ROCm的分层架构(驱动层、运行时层、编译器与框架层),重点介绍HIP编程模型与CUDA的差异及迁移策略。针对PyTorch、vLLM等主流框架,探讨ROCm适配现状与优化方案,包括性能调优技巧和常见问题排查。通过实测数据展示AMD Instinct MI300X在云端AI任务中的优势,为开发者提供从CUDA迁移到ROCm的实践指南,涵盖代码转换、环境配置到高性能部署的全流程。
2026-04-29 10:54:47
475
原创 深入浅出Harness Engineerring之核心模式与理念
文章摘要:本文系统介绍了智能体系统的技术架构与优化策略。主要内容包括:1.持久化指令管理(1.1-1.5节)探讨了指令文件维护、上下文组装、分层记忆等技术,分析了信息压缩与记忆整理的权衡;2.工作流编排(1.6节)提出探索-规划-执行循环、上下文隔离等模式;3.智能体架构设计(第2章)重点解耦大脑(Claude)、控制器(Harness)和沙盒(Sandbox)三组件,介绍凭证安全管理与多智能体协作方案;4.记忆系统优化(2.4-2.5节)提出上下文压缩、裁剪等技术;5.Hermes系统(第3章)的五段式循
2026-04-29 10:36:03
392
原创 Linux目录详解,软件应该安装到哪个目录
Linux系统有规范的软件安装目录结构,不同用途的程序应放在特定目录中。系统级软件通常安装在/usr目录(类似Windows系统目录),用户级程序建议放在/usr/local(类似Program Files)。/opt目录适合存放第三方大型软件(如测试版程序),便于单独管理或卸载。/usr/src和/usr/local/src分别用于存放系统和用户级源码。其他重要目录包括:/bin存放常用命令,/etc存放配置文件,/home是用户主目录,/root是管理员目录,/var存放日志等变化数据。这种目录规范有助
2026-04-28 17:08:54
385
H3C CAS 云计算管理平台 开局指导-E0785及之后版本-5W100-整本手册
2025-04-22
【Linux系统管理】常用命令汇总:磁盘挂载、Docker操作、防火墙配置与服务管理
2025-04-22
H3C CAS云计算管理平台 安装指导-E0785系列-5W113-整本手册
2025-04-22
2025面试经验-阿里云-交付架构师
2025-04-16
2025面试经验-科大讯飞-系统架构师
2025-04-09
2025面试经验-阿里云智能-技术服务专家
2025-04-09
2025面试经验-海康萤石-Java应用架构师
2025-04-09
2025面试经验-京东零售-Java开发
2025-04-09
【信息技术领域】系统试运行保障及应急预案:构建全面的信息系统应急响应机制与试运行保障体系为系统试运行
2025-04-03
流程规范\研发规范\代码规范\前端\React编码规范
2025-04-03
流程规范\研发规范\代码规范\前端\HTML编码规范
2025-04-03
流程规范\研发规范\代码规范\前端\Flutter编码规范
2025-04-03
流程规范\研发规范\代码规范\前端\ESLINT规范
2025-04-03
流程规范\研发规范\代码规范\后端\6.安全规约
2025-04-03
流程规范\研发规范\代码规范\后端\附:专有名词解释
2025-04-03
短视频平台调研报告.pptx
2026-05-18
AI 编程进阶:构建零干预的代码生成自愈流水线
2026-05-19
OpenClaw与Agent Skills
2026-03-11
⾦融领域⼤模型产品综合分析报告.pdf
2026-03-04
阿⾥云通义千问⾦融⼤模型深度调研报告.pdf
2026-03-04
新一代金融终端-FinceptTerminal.pptx
2026-02-03
人工智能基于云原生的AI Agent基础设施:金融领域大模型多模态应用加速落地方案设计
2025-11-10
容器编排基于Kubernetes的调度器架构与扩展机制研究:集群资源分配优化及异构算力调度实践
2025-11-10
这篇论文《Real-Time Detection of Hallucinated Entities in Long-Form Generation》提出了一种实时检测大语言模型在生成长文本时产生幻觉实
2025-10-20
第八弹-Real-Time Detection of Hallucinated Entities in Long-Form Generatio-pro.html
2025-10-20
用嘴画图:AI 一句简介:还在为画图头疼吗? * 产品画流程图,排版半天; * 售前看到竞对一张好图,想拿过来,要一笔笔画; * 开发想要架构图,还得手动画 这次分享带你体验:一句话搞定架构图流程图
2025-09-16
【大模型微调】基于Qwen3-8B的人设定制化训练:金融领域Hithink角色构建与评测系统实现
2025-09-16
【大模型微调】基于LoRA算法的LLaMA-Factory框架在法律领域中文语料上的SFT微调实践与参数优化指南
2025-09-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅