• 博客(925)
  • 资源 (3)
  • 收藏
  • 关注

原创 AI大模型推理并行策略:DP、TP、PP、SP、EP的基本原理

摘要:本文介绍了大模型推理部署中常用的并行策略,包括数据并行(DP)、张量并行(TP)、序列并行(SP)、流水线并行(PP)和专家并行(EP)。DP通过多副本处理并发请求,TP拆分模型层到不同GPU,SP处理长序列切分,PP用于显存不足时的层间流水处理,EP则专为MoE模型设计。文章还对比了CP与SP的区别,并提及Ulysses并行的数据交换机制。实际应用中需根据模型规模、硬件配置等综合选择合适的并行策略组合。这些方法能有效解决显存不足和计算效率问题,提升大模型推理性能。

2026-05-21 16:42:46 204

原创 13个 AI Agent 的基础概念

本文系统介绍了AI Agent及相关技术概念:1)AI Agent基于大语言模型,具备任务规划、记忆存储和工具调用能力,可自主完成复杂任务;2)大模型训练分为预训练(基础语言能力)和微调(场景适配)两个阶段;3)关键技术包括处理模型幻觉、MCP协议(外部资源对接)、Token分词机制、RAG检索增强等;4)Agent具备短期/长期记忆模块、Skill技能库和ReAct决策机制,支持自我反思优化;5)配套工程体系涵盖Harness工程(运行环境搭建)和SDD规格驱动开发(需求规范化)。这些技术共同构成了AI

2026-05-21 16:04:18 81

原创 Claude Code 上下文管理机制深度拆解:超长 Agent 任务如何不崩盘

企业级AI编码助手面临的核心挑战在于上下文管理:如何在有限的计算资源内高效处理复杂的项目需求、代码库和交互历史。文章揭示了ClaudeCode的上下文管理机制,包括七类分层缓存、预算预警系统、按需加载规则和五级卸载策略。关键创新点包括:动态文件缓存、会话记忆摘要、多级压缩机制以及应急处理方案。这些机制共同解决了长任务执行中的信息过载问题,确保AI在正确时间获取正确信息,同时为开发者提供了构建复杂Agent的重要参考——强调分层管理、预算预留、工具结果分级处理和上下文重建能力。

2026-05-20 16:33:11 392

原创 从Prompt、Context到Harness,工程的三次进化

AI工程的三次进化:从提示词到系统驾驭 本文揭示了AI工程领域的三次关键进化:Prompt Engineering解决如何与AI沟通的问题,Context Engineering确保AI获取正确的上下文信息,Harness Engineering则构建可靠的系统约束机制。OpenAI的实验表明,通过精心设计的Harness系统,3-7人团队能在5个月内让AI生成近百万行生产级代码。随着模型能力提升,Harness会逐渐简化,但当前阶段仍是确保AI可靠运行的关键。工程师的角色正从"写代码"

2026-05-20 16:28:13 382

原创 从“外挂”到“脑子”:LLM Agent的进化逻辑

摘要:本文综述了大模型Agent的"外化"(Externalization)演进框架,提出智能系统的核心进化在于将认知负担从模型内部转移到外部设施。研究将发展分为三个阶段:能力内嵌于权重、转移到上下文、最终外化为记忆库、技能文件和协议层。论文系统分析了外化的三个维度:记忆管理(分层存储与检索)、技能封装(可复用流程)和协议标准化(交互规范),并阐述了整合三者的Harness层的关键作用。研究指出,未来方向包括具身智能的模块化分工、自进化基础设施和共享生态建设,强调Agent系统的可靠性更

2026-05-19 11:23:27 234

原创 AI大模型对话的本质、Token、上下文窗口以及模型评估方法

《大模型Token计费指南:原理、成本与选型策略》 本文深入解析了大模型Token计费机制及其应用策略。Token作为大模型处理文本的基本单位,直接影响使用成本、模型选型和交互体验。文章从四个方面展开:1)对话本质是单向请求-响应过程,模型不保留记忆;2)上下文窗口决定模型临时记忆容量,不同产品采用分级压缩策略管理;3)计费按输入输出Token分开计算,输出成本通常是输入的3-5倍;4)提供Prompt缓存、批量API等实用省钱技巧,并对比Claude、GPT等主流模型的优劣势。最后强调模型选择应匹配具体场

2026-05-19 11:21:27 432

原创 AI开发者需要掌握的9种RAG架构

每个 AI 开发者都得了解的 9 种 RAG 架构,跳出基础 RAG 的局限,搭建靠谱的生产级 AI 系统。最好的 RAG 系统,不是最复杂的那个,而是在你的约束条件内,能可靠服务用户的那个。建议从简单的标准 RAG 开始,做好评估,衡量每一个指标,只有在有明确证据表明需要时,再增加复杂度。先把基础打牢,比盲目追求复杂架构更重要。

2026-05-19 11:17:23 451

原创 AI Agent Skill 从入门到精通:定义、结构、调用链路与底层原理

摘要: 本文系统讲解了如何从零开发生产级AI Agent Skill,涵盖Skill的定义、核心结构、设计原则及实战案例。Skill不同于普通函数,关键在于结构化描述(description、trigger rules等),使LLM能准确调用。文章详细拆解了Skill的7个核心模块(名称、描述、触发规则、参数槽位、执行逻辑、返回格式、权限控制),并通过3个实战案例(商品价格查询、折扣计算、数据库查询)演示开发流程。此外,深入探讨了Skill注册机制、调度引擎、多轮对话设计及异常处理策略,帮助开发者避开80%

2026-05-18 09:42:33 211

原创 LangGraph Hierarchical 模式:为什么你的组织层级任务总是卡在中间层?

摘要:Hierarchical模式的核心在于任务分解与动态下派,而非简单的层层审批。该架构通过CEO-VP-Manager-Engineer的层级结构实现任务分解、状态管理和异常处理,每个层级承担不同职责。生产级应用需重点关注任务分配、结果聚合和异常处理机制,避免任务卡顿和结果丢失问题。相比单一Agent方案,Hierarchical模式通过多级协作提升系统的可扩展性和可维护性,适用于需要并行处理的复杂任务场景。

2026-05-18 09:38:32 181

原创 Prefill、Decode 与 KV Cache详细介绍

摘要:大语言模型推理延迟分为Prefill和Decode两个阶段,分别受算力和内存带宽限制。Prefill阶段处理完整输入生成首个字符,依赖显卡算力;Decode阶段逐个生成后续字符,受显存带宽和KV缓存影响。KV缓存可提升长文本生成效率但占用显存,需通过量化、分页等优化手段控制资源消耗。模型量化能减少显存占用但会损失精度,需权衡效果与性能。实际优化需区分首字符延迟(TTFT)和字符间隔(ITL),针对性地精简输入、优化缓存或提升带宽。上下文扩展会显著增加计算和缓存开销,需配套优化策略。完整的问题排查流程应

2026-05-18 09:36:35 366

原创 Anthropic官方12个生产级Agent MCP设计模式

Anthropic 官方最近有一篇关于 MCP 的文章,标题是《Building agents that reach production systems with MCP》,讲的就是这个问题。文章里对比了直接 API 调用、CLI 和 MCP 这三种方式的区别,还解释了为什么现在生产级 Agent 越来越倾向于用 MCP。

2026-05-15 10:16:51 212

原创 视觉 Transformer 的演进之路:从 CNN 进化到 VIT

本文对比分析了卷积神经网络(CNN)和视觉Transformer(ViT)在计算机视觉领域的核心架构与性能差异。CNN通过局部卷积核和分层特征提取实现高效图像处理,但难以捕捉全局特征;ViT则借鉴NLP中的Transformer架构,将图像分割为补丁并利用自注意力机制实现全局特征学习。文章详细解析了两者的工作原理,并通过汽车零部件分类的实战案例展示了ViT的优势:更强的全局特征捕捉能力和迁移性,但也指出其计算成本高、数据依赖大的短板。最后建议根据任务需求选择模型:CNN适合小数据量和局部特征任务,ViT则在

2026-05-15 10:11:39 327

原创 渐渐被 AI 淘汰的 5 类程序员,这里面有你吗?

AI正在重塑程序员的工作方式,传统编码岗位面临严峻挑战。文章指出5类最易被AI取代的程序员:CRUD翻译工、复制粘贴侠、技术保守派、业务盲人和执行机器。同时提出4大转型策略:从编码转向架构评审、深耕行业领域知识、掌握AI工具链、培养产品思维。作者强调,未来程序员的核心竞争力在于"指挥AI的能力"而非编码速度,建议从业者尽快升级为"解决方案专家",才能在AI时代保持不可替代性。

2026-05-14 09:54:28 587

原创 AI Agent开发15大核心概念,建议收藏!

这篇文章主要梳理了AI Agent开发过程中可能会用到的一些概念,还会给每个概念做详细解释,帮那些从其他方向转型做AI Agent开发的开发者和团队,把对这些概念的理解统一起来,沟通的时候也能有一致的语言,减少不必要的误解,降低沟通成本。里面主要包含LLM、Chat bot、Agent等15个核心概念的说明。

2026-05-14 09:41:45 35

原创 华为和信通院发了一份AI安全报告

《2026行业数智化AI安全实践研究报告》揭示AI安全治理新挑战。报告指出,企业在AI落地过程中普遍存在"重传统安全、轻AI特有风险"的结构性矛盾,如算法偏见、模型投毒等问题。报告将风险划分为管理、技术、场景三个层面,提出"IDMAO"全生命周期治理框架,并给出金融、政务、医疗、制造四大行业的实践案例。报告强调AI安全需要系统性解决方案,建议短期建立"上线安全闸口",长期探索"以模治模"的AI免疫系统。

2026-05-13 11:17:04 215

原创 超长 Agent 任务如何不崩盘:Claude Code 上下文管理机制深度拆解

《企业级AI编码助手的上下文管理机制探析》 本文揭示了ClaudeCode等企业级AI编码助手在复杂开发场景中管理上下文的核心机制。面对项目代码、需求文档、工具调用等多源信息,系统通过七层上下文分层管理实现高效运作:1)按作用域加载规则文件;2)LRU缓存实现文件变更感知;3)大工具结果自动落盘;4)轻量级microcompact清理;5)sessionmemory滚动摘要;6)全量autocompact重建工作现场;7)reactivecompact应急处理。系统采用动态预算管理,在147K tokens

2026-05-13 10:34:24 134

原创 什么是Token?你真的懂吗?

《Token:大模型处理信息的基本单位》摘要:Token是AI模型处理各类信息时的基础计算单元,其形态随数据类型和处理需求而变化。在自然语言中,Token可能是字、词或标点;在基因组学中表现为碱基或k-mer片段;蛋白质组学里对应氨基酸或功能域;图像处理时转为视觉patch;语音识别则映射为时间帧或音素。不同于人类理解的完整语义单元,Token是模型将复杂信息分解后的计算颗粒,其切分方式直接影响模型处理效果。理解Token的多样性(从DNA碱基到图像方块)是掌握AI工作原理的重要基础。

2026-05-13 10:31:57 439

原创 Namespace 为什么不够用了:容器逃逸的技术原理与真实攻击链

摘要: 容器逃逸漏洞暴露了共享内核架构的致命缺陷。Namespace 和 cgroups 仅提供资源视图隔离,无法阻止内核级攻击。本文分析三类真实漏洞: 内核漏洞逃逸(如 Dirty COW、CVE-2022-0185):容器内触发内核提权漏洞(如内存竞争、堆溢出),直接穿透 Namespace 获取宿主机 root 权限。 运行时漏洞逃逸(如 CVE-2019-5736):利用 runc 文件描述符泄漏覆盖宿主机二进制文件,或通过恶意镜像(如篡改 WORKDIR)读写宿主机文件系统。 符号链接逃逸(202

2026-05-12 15:05:23 1099

原创 PaaS 平台 CI 能力扩展可行性分析及平台价值描述

本文分析了PaaS平台扩展持续集成(CI)能力的可行性及价值。技术层面,通过引入云原生构建引擎可实现代码到镜像的自动化构建,技术选型成熟且与现有平台兼容。安全方面可复用沙箱隔离技术保障构建安全。实施计划分三阶段4个月完成,最终形成覆盖CI/CD全生命周期的应用管理平台。扩展后的平台具备多语言支持、安全左移、构建加速等核心能力,提供企业级应用交付解决方案,对标商业产品价值,支撑100万元报价。该升级将显著提升研发效能并降低安全风险。

2026-05-12 10:44:15 313

原创 4个问题 + 1个Demo:Agent2Agent(A2A)

谷歌推出A2A协议实现AI智能体间标准化协作 摘要:谷歌最新推出的A2A(Agent2Agent)协议旨在解决不同AI智能体间的互操作问题。该协议通过标准化通信机制(JSON-RPC2.0与HTTP)、安全验证等组件,使异构智能体能够高效协作。A2A架构包含AgentCard(能力描述)、A2AServer(服务入口)和A2AClient(调用端)三个核心组件,支持流式处理、多轮对话和异步任务等复杂场景。与MCP协议(解决智能体与工具集成)不同,A2A专注于智能体间的高层次协作。演示案例展示了搜索智能体通过

2026-05-11 09:43:25 499

原创 拆解、对比与优化:LLM工具智能体的五种任务规划与执行模式

摘要:本文探讨了AI智能体的五种任务规划与执行模式:1)ReAct模式通过思考-行动交替实现动态规划;2)Plan-and-Execute模式先规划后执行;3)静态Workflow采用预设流程;4)混合模式结合静态流程与局部智能;5)分层规划通过高层与低层智能体协作。每种模式各有优劣,适用于不同场景。文章还提出了工具标注增强、案例增强等优化方法,建议根据业务需求灵活选择或组合使用这些模式,以提升智能体的任务执行效率与可靠性。(149字)

2026-05-11 09:39:58 596

原创 Agentic RAG的前世今生

摘要: AgenticRAG是融合智能体(Agent)自主推理能力的检索增强生成(RAG)技术,旨在解决传统RAG在复杂查询任务中的局限性。传统RAG依赖单一检索流程,而AgenticRAG通过动态规划检索策略、多数据源融合、工具调用及自我反思等能力,适应多样化需求(如多步骤查询、跨系统数据整合)。其架构分为单Agent(协调工具)和多Agent(分层协作)两种形式,显著提升检索灵活性与准确性,但也面临延迟和不确定性等挑战。AgenticRAG标志着RAG向更智能、任务导向的演进。

2026-05-11 09:35:25 325

原创 什么是 OpenClaw?

OpenClaw 原名 Clawdbot,是一款可运行在个人环境中的高权限 AI 智能体,支持通过 WhatsApp、飞书、Telegram 等常用聊天软件交互,能实现邮件发送、日程管理、数据查询等自动化任务,且数据隐私自主可控,搭配腾讯云 Lighthouse 可实现 7*24 小时无间断运行(下文为适配操作场景,部分环节仍沿用"Clawdbot"表述,均指代同一产品OpenClaw)。

2026-05-09 10:23:14 530

原创 Agent = Model + Harness! Harness 的设计与未来!

本文探讨了Harness工程在构建智能体(Agent)系统中的核心作用。文章指出,Agent由模型(Model)和Harness两部分组成,其中Harness指所有不属于模型本身的代码、配置和执行逻辑。Harness工程通过提供状态管理、工具调用、反馈循环等能力,将裸模型转化为可实际工作的Agent。文章详细分析了Harness的关键组件,包括文件系统实现持久存储、Bash和代码执行作为通用工具、沙箱环境确保安全执行、记忆与搜索实现持续学习等。同时讨论了Harness如何解决上下文退化(ContextRot

2026-05-09 10:18:02 320

原创 AI Agent 沙箱的实现机制深度解析

沙箱技术通过三层架构实现硬件级隔离与极速启动:1. Linux Namespace进程伪装提供基础隔离;2. gVisor系统调用拦截增强安全性;3. MicroVM硬件虚拟化结合内存快照技术,将冷启动时间压缩至60毫秒,内存开销低于5MB。该方案采用预分配资源池、快照模板克隆和写时复制内存共享技术,突破传统虚拟化性能瓶颈,实现比容器更安全、比虚拟机更快的特性。网络层面通过eBPF实现内核态虚拟化,配合五层纵深防御体系,为AI代码执行等场景提供高安全隔离环境。

2026-05-09 10:13:24 516

原创 DeepSeek终于能看懂图了:这次不只是识图,而是让模型学会“边指边想”

识图模式目前还是灰度,不是全量发布。媒体实测也显示,基础画面描述、文字读取、常见物体理解表现不错,但遇到隐藏图形、碎块化反色图、复杂数量统计、图形逻辑题时仍会出错。比如有测试中,老虎数量题正确答案为 10,只回答成 7;隐藏数字类图片也没有识别出来。这说明它现在更像是 “可用的视觉理解入口 + 研究型视觉推理机制”,还不是一个稳定碾压 GPT、Claude、Gemini 的全能多模态模型。另外,官方 GitHub 也写得比较谨慎:目前发布的是技术报告,未来计划开放内部 benchmark 和一部分

2026-05-08 14:12:37 597

原创 AI网关技术深度解析

AI网关正从“概念”走向“必备基建”。无论是选择功能全面的APISIX系方案,还是轻量高效的LiteLLM,核心都在于理解自身业务对模型多样性、成本敏感度、安全合规和技术栈匹配度的需求。当模型即服务(MaaS)逐渐成为常态,AI网关将承担起连接、保护、优化和治理的关键角色。希望本文对两大主流方案的剖析,能帮助您找到最适合的架构演进路径。

2026-05-08 14:01:40 504

原创 AI Infra 其实没有多少新东西

本文分享了AI基础设施(AIInfra)领域的实践经验与技术挑战。文章首先分析了从CPU为中心到GPU为中心的硬件革命,指出GPU已成为大模型计算的核心,并探讨了"AI大型机"集中式架构的必然性。在软件层面,介绍了PyTorch深度学习框架、GPU编程和Python语言在AI开发中的核心地位。针对模型训练,重点讨论了"存得下"(模型并行)和"算得快"(通信计算重叠)两大挑战。在模型推理方面,提出了降低延迟(CUDAGraph、KVCache)和提高

2026-05-08 13:40:42 377

原创 Linux内核“Copy Fail”漏洞深度解析:从零拷贝优化到稳定提权的技术全貌

Linux内核高危漏洞CVE-2026-31431(代号Copy Fail)被披露,该漏洞存在于内核加密子系统的零拷贝优化中,允许普通用户稳定提权至root。漏洞源于AF_ALG套接字与authencesn算法组合时,通过splice零拷贝机制可导致4字节越界写入,直接篡改目标文件页缓存。攻击者可利用此漏洞修改setuid程序内存内容,实现隐蔽提权且不留磁盘痕迹。影响主流Linux发行版,建议立即升级内核或临时禁用algif_aead模块。该漏洞揭示了零拷贝技术与安全边界验证不足带来的风险。(150字)

2026-05-07 14:17:08 611

原创 Skills 库干掉 60% 手工测试:测试团队效率跃迁的底层逻辑与实战路径

测试团队大量工时正被编写与维护用例、脚本、数据和日志分析等重复性工作消耗,而一套由“需求转用例、API 脚本生成、测试数据合成、失败日志诊断、UI 自动自愈”五类能力组成的 AI Skills 库,正在成为提升效率的关键方法。它并非简单的 Prompt 或脚本集合,而是可组合、可评估、可持续演进的能力体系;若设计和落地得当,测试团队在 12 个月内实现 50%—60% 的效率提升具有现实可行性。

2026-05-07 14:03:22 549

原创 从 DevOps 到 Dev+SkillsOps:研发模式升级

前段时间,一个做了八年 DevOps 平台的朋友跟我吃饭,聊到他们最近在做的事情。 他说:"我们把 CI/CD 做得很顺了,流水线一键跑,部署自动化,监控告警全覆盖。但有个问题我一直没想明白——为什么每次大版本发布,我们还是会出那么多低级错误?" 我问他:那些错误是什么类型的? 他说大部分都是"本来应该被测到的"——边界没覆盖、兼容性没验证、历史坑没规避。不是流程出了问题,是知识没有流动起来...

2026-05-07 13:54:42 577

原创 使用 Claude Code 生产可持久化内容:HarmonyOS Snapshot 内存泄漏分析实践(THS)

本文记录了一次使用 Claude Code Opus 辅助分析 HarmonyOS Snapshot 内存泄漏的工程实践。与单次问答式分析不同,本文关注的是如何把分析过程中形成的资料、脚本、方法论和报告模板沉淀为可复用资产,使后续同类问题可以从已有知识和工具链继续推进。文章以分时页内存上涨问题为背景,介绍从资料准备、Skill 固化、脚本工具链建设,到自动化分析、人工复核和交叉验证的完整流程,并通过一个脚本分析的泄漏案例说明该方法在真实问题中的定位效果。

2026-05-06 09:45:04 392

原创 Transformer原理大白话讲解

《图解Transformer:AI黄金时代的核心引擎》 这篇文章用生活化比喻解析了Transformer的工作原理。Transformer由编码器和解码器组成,编码器像语文老师逐层理解句子,解码器像作家根据理解生成翻译。其核心是自注意力机制,让模型在处理每个词时都能关注句子其他部分,通过Q/K/V矩阵计算词间关系。文章还解释了位置编码、残差连接等关键技术,以及Transformer并行计算的优越性。正是这套机制支撑了ChatGPT等现代AI系统,成为自然语言处理的基石。

2026-05-06 09:38:21 656

原创 读完 Claude Code 源码才发现:Skills、MCP、Rules 的区别,远没有你想的那么大

通过对Claude Code源码的分析,揭示了Rules、MCP、Skills三个概念的底层实现机制。Rules是项目级行为规范,通过messages被动注入;MCP是标准化工具协议,在system和tools中注册并调用外部服务;Skills是可复用提示词,通过tool_use触发后注入指令文本。三者的核心区别在于信息在API请求中的位置不同,而非功能本质...

2026-05-06 09:28:40 417

原创 Claude Code 全攻略:命令大全 + 实战工作流

本文详细介绍了ClaudeCode终端AI助手的使用方法,包含四个核心部分:1)常用命令如版本查看、项目启动和更新;2)三种工作模式(默认、自动接受、计划)的切换及界面说明;3)指令速查表,涵盖初始化、压缩对话、清除历史等操作;4)关键命令详解,包括/init初始化项目、/help查看帮助、/clear重置会话等。文章通过界面截图和场景示例,指导开发者如何高效使用命令行和交互功能,特别强调了PlanMode规划与Auto-Accept执行的配合使用,以及通过/memory管理项目知识库的最佳实践。

2026-04-30 10:44:57 289

原创 从 Demo 到生产:NVIDIA RAG 部署课程学习与 Mirror 实践启发(THS)

本文基于 NVIDIA Deep Learning Institute 的《在生产环境大规模部署 RAG 工作流》课程,围绕 NIM、RAG、K8s/Helm/Operator、监控弹性、多模态与 Agentic AI 等主线,从工程实践角度总结课程内容,并结合 Mirror 平台的实际场景提供启发。

2026-04-30 10:40:39 393

原创 vLLM 硬核四连发

vLLM在2026年3月推出四大核心更新:1)SemanticRouter v0.2 Athena升级为多模型编排系统;2)Nemotron3 Super MoE模型优化多智能体协作;3)P-EAGLE实现并行推测解码突破性能瓶颈;4)ModelRunner V2重构底层引擎提升56%吞吐量。这些更新从推理加速、多模型调度到智能体操作系统全面升级,推动vLLM从单一推理引擎向AI推理平台转型。其中P-EAGLE通过单次前向传播生成所有草稿token,Nemotron3 Super则凭借120B参数/12B激

2026-04-29 11:00:42 683

原创 从 CUDA 到 ROCm:AMD 云端 AI 开发的全栈迁移与性能优化实践

摘要: AMD ROCm平台作为开源GPU计算解决方案,在AI训练与推理领域快速发展。本文系统解析ROCm的分层架构(驱动层、运行时层、编译器与框架层),重点介绍HIP编程模型与CUDA的差异及迁移策略。针对PyTorch、vLLM等主流框架,探讨ROCm适配现状与优化方案,包括性能调优技巧和常见问题排查。通过实测数据展示AMD Instinct MI300X在云端AI任务中的优势,为开发者提供从CUDA迁移到ROCm的实践指南,涵盖代码转换、环境配置到高性能部署的全流程。

2026-04-29 10:54:47 475

原创 深入浅出Harness Engineerring之核心模式与理念

文章摘要:本文系统介绍了智能体系统的技术架构与优化策略。主要内容包括:1.持久化指令管理(1.1-1.5节)探讨了指令文件维护、上下文组装、分层记忆等技术,分析了信息压缩与记忆整理的权衡;2.工作流编排(1.6节)提出探索-规划-执行循环、上下文隔离等模式;3.智能体架构设计(第2章)重点解耦大脑(Claude)、控制器(Harness)和沙盒(Sandbox)三组件,介绍凭证安全管理与多智能体协作方案;4.记忆系统优化(2.4-2.5节)提出上下文压缩、裁剪等技术;5.Hermes系统(第3章)的五段式循

2026-04-29 10:36:03 392

原创 Linux目录详解,软件应该安装到哪个目录

Linux系统有规范的软件安装目录结构,不同用途的程序应放在特定目录中。系统级软件通常安装在/usr目录(类似Windows系统目录),用户级程序建议放在/usr/local(类似Program Files)。/opt目录适合存放第三方大型软件(如测试版程序),便于单独管理或卸载。/usr/src和/usr/local/src分别用于存放系统和用户级源码。其他重要目录包括:/bin存放常用命令,/etc存放配置文件,/home是用户主目录,/root是管理员目录,/var存放日志等变化数据。这种目录规范有助

2026-04-28 17:08:54 385

Artifactory文件

Artifactory文件

2025-04-25

H3C CAS 云计算管理平台 开局指导-E0785及之后版本-5W100-整本手册

内容概要:本文档《H3C CAS 云计算管理平台 开局指导-E0785及之后版本-5W100-整本手册》主要介绍了H3C CAS云计算管理平台的开局准备、规划、安装和配置。文档详细描述了工程开局前的环境、服务器和安装文件准备,涵盖网络、存储、主机池、集群、主机和虚拟机的规划与配置。此外,还提供了云资源管理、虚拟机模板管理、CVM备份、监控和告警等功能的配置指导,并附带了可靠性测试和常见问题解答。文档适用于E0785及之后版本的产品,旨在帮助用户顺利完成H3C CAS平台的部署与配置。 适合人群:具备一定云计算基础知识,从事H3C CAS云计算管理平台部署和维护的技术人员。 使用场景及目标:①为数据中心管理员提供详细的开局指导,确保H3C CAS平台的顺利部署;②帮助技术人员理解并掌握H3C CAS平台的网络、存储、主机和虚拟机配置;③指导用户进行云资源管理和监控,确保平台的稳定性和可靠性;④提供可靠性测试方法,确保平台在上线前经过充分验证。 阅读建议:此文档内容详尽,建议读者在实际部署前仔细阅读并参考相关章节,结合具体应用场景进行实践操作。重点理解网络规划、存储配置、主机和虚拟机的创建与管理等内容,确保所有配置符合最佳实践。同时,注意文档中的注意事项和警告信息,以避免潜在问题。

2025-04-22

Onestep-MySQL自动安装脚本

Onestep-MySQL自动安装脚本

2025-04-22

Onestep-ES自动安装脚本

Onestep-ES自动安装脚本

2025-04-22

【Linux系统管理】常用命令汇总:磁盘挂载、Docker操作、防火墙配置与服务管理

内容概要:本文档《Linux实用命令.txt》涵盖了Linux系统管理中常用的命令和操作,包括磁盘管理(如磁盘挂载、扩展逻辑卷)、Docker容器管理(启动、停止、清理日志)、防火墙配置(端口管理、IP白名单设置、端口转发)、Nginx服务配置、文件压缩与解压、内存释放、时间同步、ELK日志系统接入、YAPI服务重启、Jenkins构建记录清理、SFTP服务配置、SCSI控制器刷新、网络配置以及GitLab和Nexus3的相关操作。文档通过具体命令示例详细介绍了各个操作步骤,帮助管理员快速掌握Linux系统管理和维护技能。 适合人群:适合具有Linux基础的系统管理员和技术支持人员,尤其是那些需要进行日常服务器运维和管理工作的人员。 使用场景及目标:① 对于磁盘管理,能够熟练进行磁盘挂载、扩展和格式化;② Docker管理方面,掌握容器的启动、停止、日志清理等操作;③ 防火墙配置上,学会端口开放、关闭、IP白名单设置和端口转发;④ 掌握Nginx服务配置、文件压缩解压、内存释放等常用操作;⑤ 学习如何接入ELK日志系统、重启YAPI服务、清理Jenkins构建记录、配置SFTP服务、刷新SCSI控制器、修改IP地址以及GitLab和Nexus3的部署与管理。 阅读建议:由于文档涉及多个方面的Linux系统管理命令,建议读者在实际环境中逐步实践每个命令,结合官方文档和其他参考资料加深理解。对于复杂的操作(如防火墙配置、Docker管理等),建议先在一个测试环境中进行实验,确保熟悉后再应用于生产环境。

2025-04-22

Onestep-minio自动安装脚本

Onestep-minio自动安装脚本

2025-04-22

Onestep-JDK自动安装脚本

Onestep-JDK自动安装脚本

2025-04-22

H3C CAS云计算管理平台 安装指导-E0785系列-5W113-整本手册

内容概要:本文档是新华三技术有限公司发布的《H3C CAS云计算管理平台 安装指导-E0785系列-5W113-整本手册》,涵盖H3C CAS云计算管理平台的安装指导,包括产品简介、安装前准备、网络及存储规划、安装步骤、访问管理服务器、常见问题解答及附录。文档详细描述了CAS的组成、服务器类型、安装流程、网络及存储规划、安装后的配置方法,以及访问管理服务器的方法。此外,还提供了常见问题解答和附录内容,如制作U盘启动盘和配置飞腾服务器网络参数。 适合人群:具备一定IT基础的网络规划人员、现场技术支持与维护人员、负责网络配置和维护的网络管理员。 使用场景及目标:①帮助用户了解H3C CAS云计算管理平台的功能和应用场景;②指导用户完成CAS的安装和配置,确保安装过程顺利进行;③提供网络及存储规划的建议,确保系统的稳定性和高效性;④解决用户在安装和使用过程中可能遇到的问题。 其他说明:本手册内容详尽,旨在为用户提供全面的安装和配置指导,确保用户能够顺利完成H3C CAS云计算管理平台的部署和使用。文档强调了安装前的准备工作、网络及存储规划的重要性,并提供了详细的安装步骤和配置指南。同时,手册中包含了大量的图表和命令示例,便于用户理解和操作。此外,文档还提供了常见问题解答,帮助用户解决可能遇到的技术难题。

2025-04-22

2025面试经验-阿里云-交付架构师

内容概要:本文详细介绍了阿里云智能-泛企业交付架构师(政企业务)在面试过程中可能遇到的问题及应对方案。涵盖了技术能力与架构设计、项目管理与交付能力、行业经验与客情处理、技术预研与标准化以及行为面试与文化匹配五个方面。具体包括优化APP项目的部署架构,融合大模型与隐私计算保障医疗数据隐私,协调公共数据运营平台项目中的多方资源,解决信创场景下的技术难题,结合LangChain与知识图谱提升智能客服准确性,以及因技术方案超出客户预期而带来额外商机的经历。每个问题都按照STAR法则展开,即情境(Situation)、任务(Task)、行动(Action)和结果(Result),充分展示了候选人的专业能力和解决问题的实际经验。; 适合人群:具备一定云计算、架构设计及项目管理经验,有意应聘阿里云交付架构师职位的专业人士。; 使用场景及目标:①帮助求职者深入了解阿里云交付架构师岗位的面试流程和技术要求;②为准备类似职位面试的人士提供参考案例和答题思路;③指导候选人如何系统化展现自己的复杂架构设计能力、政企行业理解深度及阿里云生态融合力。; 阅读建议:此文档不仅提供了具体的面试问题及答案模板,还强调了技术细节和实际操作中的注意事项,因此在阅读时应重点关注解决方案的具体实施步骤和技术原理的阐述,同时注意文化匹配部分对于“客户第一”价值观的体现。

2025-04-16

2025面试经验-科大讯飞-系统架构师

内容概要:本文档涵盖多个技术主题,包括微服务与分布式架构的区别与联系、云原生与CI/CD的关系、MySQL的组成部分、Java GC排查方法、Java设计模式、Nacos集群模式的使用、以及高并发预约系统的架构设计。其中,微服务与分布式架构部分详细对比了两者的概念、设计理念、通信机制和数据管理策略,并探讨了两者之间的相互依存关系。云原生与CI/CD部分阐述了云原生如何通过基础设施弹性适配和容器化技术为CI/CD赋能,而CI/CD又如何助力云原生应用的持续集成与交付。MySQL部分介绍了其核心组件,如数据库服务器、存储引擎、SQL解析与优化器及客户端接口。Java设计模式部分列举了常见的设计模式及其应用场景。Nacos部分解释了单体与集群部署的区别及配置修改。高并发预约系统架构设计部分详细描述了系统的技术栈、架构分层、关键技术细节、性能优化、压测与监控、核心流程及容灾备份方案。 适合人群:具备一定编程基础和技术背景的研发人员、系统架构师、运维工程师。 使用场景及目标:①深入理解微服务与分布式架构的设计理念与技术特性,掌握两者在实际项目中的应用;②了解云原生与CI/CD的关系,掌握如何通过云原生技术优化CI/CD流程;③熟悉MySQL的内部结构与工作原理,提升数据库管理和优化能力;④掌握Java设计模式的应用场景与实现逻辑,提高代码设计与架构能力;⑤理解Nacos集群模式的配置与使用,提升服务发现与配置管理能力;⑥学习高并发预约系统的架构设计,掌握如何构建高性能、高可用的分布式系统。 阅读建议:文档内容较为全面,涉及多个技术领域,建议读者根据自身需求和技术背景选择感兴趣的部分进行重点学习。对于系统架构师和高级开发人员,可以重点关注微服务与分布式架构、云原生与CI/CD、以及高并发预约系统架构设计部分;对于数据库管理员,可以重点关注MySQL的组成部分;对于Java开发人员,可以重点关注Java设计模式部分。在学习过程中,结合实际项目经验和相关工具进行实践,有助于更好地理解和应用所学知识。

2025-04-09

2025面试经验-阿里云智能-技术服务专家

内容概要:本文主要介绍阿里云智能技术服务专家职位的相关信息。作为阿里云客户技术服务的第一负责人,该职位需要深入了解客户业务场景,与客户的架构、开发、运维团队合作,优化云上业务稳定性,包括云上监控、灾难演练、高可用架构改造等。同时,还需与阿里云各团队合作,解决客户问题,沉淀最佳实践及工具产品。职位要求包括3年以上大型互联网应用或集团型企业应用的经验,3年以上的大型项目管理和团队管理经验,以及优秀的沟通技巧、文档写作能力等。加分项包括阿里云技术认证、大规模应用开发或运维经验、英语能力。此外,文中还提及了计算机网络七层协议、Docker网络等技术知识,为面试提供了相关建议。 适合人群:具备3年以上泛娱乐、零售、金融、教育等行业大型互联网应用或集团型企业应用的解决方案、架构设计、监控方案、Devops、AIops、维护、高可用改造方案经验的人士;3年以上的大型项目管理和团队管理经验者;有责任心,能实践“客户第一”理念,并成就客户的人士;具有优秀沟通技巧、团队合作经验、敬业精神和学习能力的人士;具有较强抗压能力和执行力,并能接受一定频率出差的人士。 使用场景及目标:①深入理解客户业务场景,与客户团队合作优化云上业务稳定性;②与阿里云各团队合作,解决客户问题,沉淀最佳实践及工具产品;③追踪行业重点客户关键稳定性问题,协助客户治理并推动阿里云产品及服务的优化改进;④准备面试,掌握计算机网络七层协议、Docker网络等技术知识,提高面试成功率。 其他说明:文中详细介绍了计算机网络七层协议的功能、设备和应用,以及Docker网络的主要功能和网络类型分析,为面试提供了技术背景支持。建议面试者深入理解这些技术知识,以便更好地应对面试中的技术问题。

2025-04-09

2025面试经验-海康萤石-Java应用架构师

内容概要:本文详细介绍了海康萤石Java应用架构师职位的职责和要求,涵盖了高并发、分布式系统的设计与优化,以及对Java核心技术的深入理解。此外,文章还探讨了三种常见的消息中间件(RocketMQ、ActiveMQ、Kafka)的特点与区别,Redis分布式锁的实现方式及其优缺点,管理一千万台物联网设备的架构设计,包括设备接入、数据处理、存储、管理和安全保障等方面。最后,文章讲解了Spring框架中Starter的实现、解决对象循环引用的方法、网关按业务分流的配置,以及Java JVM的自动性能优化机制和WAF流量接入方式。 适合人群:具备多年Java开发经验,特别是有高并发系统设计、优化改进及开发经验的研发人员和架构师。 使用场景及目标:①理解高并发、分布式系统的设计与优化;②掌握Redis分布式锁的实现方式;③学习大规模物联网设备管理的架构设计;④实现Spring框架中的Starter并解决对象循环引用问题;⑤配置Spring Cloud Gateway按业务进行后端微服务分流;⑥了解Java JVM的自动性能优化机制;⑦掌握WAF流量的不同接入方式及其应用场景。 阅读建议:本文内容详实,涉及多个技术领域的知识点,建议读者根据自身需求重点阅读相关章节,并结合实际项目进行实践。对于架构师而言,应重点关注系统设计和优化部分;对于开发人员,建议深入理解Spring框架和JVM优化的内容。

2025-04-09

2025面试经验-京东零售-Java开发

内容概要:本文详细介绍了京东零售Java后端开发岗位的面试经验和要求,涵盖技术背景、ES深度分页解决方案、Synchronized实现原理及其优化、MySQL事务隔离级别、MySQL多版本并发控制(MVCC)、MySQL乐观锁、MySQL Undo日志与Binlog的区别、Redis大key处理、Java弱引用、Synchronized使用场景、RocketMQ保证消息不丢失的方法以及秒杀系统的设计要点。针对每个主题,文章不仅阐述了基本概念,还提供了具体的应用场景和技术实现细节。 适合人群:具备一定编程基础,尤其是Java后端开发经验的工程师,特别是准备面试或从事相关工作的研发人员。 使用场景及目标:①帮助读者理解并掌握京东零售Java后端开发岗位所需的技能和知识点;②为面试者提供全面的技术准备指南,包括但不限于搜索/推荐系统、高并发处理、数据库优化、消息队列等;③指导开发人员在实际项目中应用这些技术,提高系统的性能、可靠性和扩展性。 其他说明:本文内容丰富,涵盖了从基础知识到高级应用的多个方面,适合不同层次的技术人员学习参考。建议读者根据自身需求重点阅读感兴趣的部分,并结合实际工作中的问题进行深入研究和实践。

2025-04-09

【信息技术领域】系统试运行保障及应急预案:构建全面的信息系统应急响应机制与试运行保障体系为系统试运行

内容概要:本文档《模板-系统试运行保障及应急方案》详细阐述了系统试运行保障及应急预案,旨在确保系统在试运行期间的稳定性和可靠性,以及在突发事件发生时能够迅速、有效地应对。主要内容包括试运行保障方案、应急预案及其组织保障、应急处置流程、事件分级及响应机制、通信与物资保障、技术与人员保障、后期保障等方面。试运行保障方案明确了试运行的目的、内容、环境要求、人员组织计划及日常巡检与问题记录机制;应急预案则针对不同级别的信息系统突发事件制定了详细的应急响应措施,确保在突发事件发生时能够最大限度地减少损失和影响。此外,还强调了后期观察、业务和数据恢复保障、调查与评估及改进措施的重要性。 适用人群:适用于系统集成商、运维工程师、项目经理、信息安全管理专员等参与系统试运行和应急管理的专业人士。 使用场景及目标:①为系统试运行期间提供全面的保障措施,确保系统稳定运行;②针对不同级别的信息系统突发事件制定应急响应策略,确保快速恢复系统正常运作;③通过后期观察、业务和数据恢复保障等措施,确保系统长期稳定运行;④通过对突发事件的调查与评估,总结经验教训,持续改进应急预案。 其他说明:文档中提供了详细的应急处置流程和技术保障要求,强调了预防为主、快速响应、统一指挥、分级管理和健全机制的工作原则。同时,还提出了加强应急技术支持队伍建设、提高人员业务素质和技术水平的要求,确保在突发事件发生时能够高效应对。

2025-04-03

流程规范\研发规范\代码规范\前端\React编码规范

内容概要:本文档《React编码规范.docx》旨在定义统一的React编码风格,确保代码的一致性和可维护性。文档详细规定了React代码的基本原则、命名规则、引号使用、空格处理、属性命名、标签使用以及方法定义等方面的规范。基本原则包括每个文件只包含一个React组件,优先使用JSX语法和函数式组件。命名规则强调使用帕斯卡命名法进行文件名和组件引用的命名,并避免使用displayName命名组件。引号使用上,JSX和HTML属性使用双引号,而JS属性则使用单引号。空格方面,禁止在JSX花括号内添加空格。属性命名要求采用小驼峰命名法,避免使用数组索引作为key值。标签使用上,没有子组件的父组件应使用自闭合标签。方法定义方面,建议使用箭头函数访问本地变量,并在构造函数中绑定事件处理函数。 适合人群:熟悉JavaScript和React框架的前端开发人员,尤其是希望提高代码质量和一致性的团队成员。 使用场景及目标:①帮助开发人员编写符合行业标准的React代码;②确保团队内部代码风格统一,便于协作和维护;③减少因编码风格不一致带来的错误和复杂度。 阅读建议:此文档是React项目开发的基础指导文件,建议开发者在编写React应用时严格遵循这些规范,以确保代码的可读性和可维护性。同时,在实践中不断调整和优化编码习惯,逐步形成更加成熟和高效的开发流程。

2025-04-03

流程规范\研发规范\代码规范\前端\HTML编码规范

内容概要:本文档旨在规范HTML代码风格,确保HTML代码的一致性、易读性和可维护性。首先介绍了HTML5的DOCTYPE声明方式和字符编码设置,强调了字符编码声明的位置和无BOM的UTF-8编码的重要性。接着讲述了CSS和JavaScript的引入位置,建议CSS在head中引入,JavaScript放在页面末尾或采用异步加载,并提倡省略嵌入式资源的协议头和忽略type属性。文档还规定了title和favicon的设置方法,以及针对移动设备友好的viewport设置。此外,明确了缩进与换行的规则,要求使用2个空格作为缩进层级,每行不超过120个字符。对于命名规则,class和id必须全字母小写并以“-”分隔,id需保证页面唯一性,少用id选择器。标签方面,要求标签名和属性名均用小写字母,属性值用双引号包围,自定义属性加前缀。最后强调了语义化的HTML元素使用,为图片和多媒体提供了降级方案,如添加alt属性、区分下载需求的图片实现方式等。; 适合人群:前端开发人员,尤其是希望提升HTML代码质量的开发者。; 使用场景及目标:①帮助开发者编写符合规范的HTML代码,提高代码的可读性和可维护性;②确保页面在不同浏览器和设备上的兼容性和一致性;③优化页面加载速度和用户体验。; 其他说明:遵循这些编码规范不仅能使代码更加整洁美观,还能减少潜在的错误和技术债务,建议开发者在日常工作中严格遵守。

2025-04-03

流程规范\研发规范\代码规范\前端\Flutter编码规范

内容概要:本文档详细介绍了 Flutter 的编码规范,旨在帮助开发者编写更高效、易读和一致的代码。文档涵盖了代码风格(如标识符命名规则、大驼峰命名法用于类和枚举、小驼峰用于其他标识符)、排序(如导入语句的顺序)、注释(如使用///进行文档注释)、字符串处理(如使用模板字符串)、集合操作(如使用高阶方法转换序列)、参数使用(如命名参数默认值用=号)、变量初始化(如避免显式初始化为null)、类成员设计(如优先使用final字段)、构造函数(如使用初始化形式)以及异步编程(如优先使用async/await)。; 适合人群:具备一定编程基础,尤其是正在或即将从事 Flutter 开发的工程师。; 使用场景及目标:①确保团队内部代码风格统一,提高代码质量和协作效率;②帮助开发者快速掌握 Flutter 编程的最佳实践,减少常见错误;③通过规范化的代码提升应用性能和维护性。; 阅读建议:此文档提供了详细的编码规范指南,建议读者在实际开发过程中反复参照,并结合具体项目实践,逐步形成良好的编码习惯。同时,对于不熟悉的语法或概念,可以通过官方文档进一步学习。

2025-04-03

流程规范\研发规范\代码规范\前端\ESLINT规范

内容概要:本文档详细介绍了ESLint这一开源JavaScript代码检查工具,从其创立背景说起,强调了在多人协作开发环境下统一代码规范的重要性。文中列举了ESLint规则分类,包括可能导致错误、最佳实践、严格模式相关、变量定义相关、Node.js和CommonJS、风格指南以及ECMAScript 6等类别。同时,文档提供了具体的ESLint配置示例,涵盖parser、env、plugins、extends和rules等关键设置项。此外,还特别提到了前端项目中推荐的质量保障方式,即ESLint结合husky和Lint-staged使用,确保代码提交前经过严格的格式检查。最后,分别给出了Vue和React项目的ESLint配置模板,帮助开发者快速集成到各自项目中。 适合人群:有一定JavaScript编程经验,尤其是参与团队协作开发的前端工程师或全栈工程师。 使用场景及目标:①为团队建立统一的JavaScript代码规范,减少因个人编码习惯差异带来的沟通成本;②确保项目代码质量,避免潜在错误,提高代码可维护性和可读性;③掌握如何将ESLint集成到现有项目中,利用自动化工具提升开发效率。 其他说明:文档不仅提供了理论指导,还附带实际操作指南,如初始化配置、安装依赖包以及具体配置代码片段,方便读者直接应用于项目实践。

2025-04-03

流程规范\研发规范\代码规范\后端\6.安全规约

内容概要:本文档详细列出了九项安全规约,旨在确保软件系统的安全性。其中涵盖用户权限控制、数据脱敏、SQL参数绑定、参数有效性验证、HTML输出过滤、CSRF安全验证、URL重定向白名单、平台资源防重放机制以及用户生成内容的风控策略。每一项规约都附有具体说明和反例,强调了遵循这些规则的重要性,以防止诸如SQL注入、隐私泄露、跨站请求伪造等多种安全风险。 适合人群:适用于所有参与软件开发和维护的技术人员,特别是负责系统安全架构的设计者和开发者。 使用场景及目标:①确保涉及用户个人数据的页面或功能模块实施严格的权限控制;②防止敏感信息泄露,保护用户隐私;③避免因不当的SQL操作引发的安全隐患;④确保所有用户输入经过严格验证,防止各种类型的注入攻击和其他恶意行为;⑤保障HTML页面输出的安全性,防止XSS攻击;⑥防止CSRF攻击,保护用户免受跨站请求伪造的危害;⑦确保外部重定向的安全性,防止恶意跳转;⑧合理使用平台资源,防止滥用;⑨有效管理用户生成的内容,防止垃圾信息和违规内容传播。 阅读建议:本规约文档为强制性和推荐性安全措施提供了详细的指导,建议开发

2025-04-03

流程规范\研发规范\代码规范\后端\附:专有名词解释

内容概要:本文档详细解释了软件开发尤其是Java开发中常用的专有名词。其中包括不同类型的对象如POJO、DO、PO、DTO、BO、Query、Form、VO、AO及其各自的作用范围和特点;介绍了CAS机制,一种提高多线程环境下性能的操作;阐释了GAV的概念,即Maven坐标用于唯一标识jar包;提及OOP,指面向对象编程;解释了AQS,这是许多同步类的基础;简述了ORM框架,像iBATIS和mybatis,它们实现了对象与数据库记录之间的映射;还提到了常见的错误如NPE和OOM。最后区分了一方库、二方库和三方库的概念,分别指代内部模块依赖、公司内部共享以及外部开源的库。; 适合人群:Java开发人员,尤其是对Java开发中常见名词概念需要进一步理解的人群。; 使用场景及目标:①帮助开发人员准确理解并正确使用这些术语;②为开发人员提供参考,确保团队内部交流的一致性和准确性。; 其他说明:这些名词解释不仅有助于提升代码质量,还能促进团队成员之间的沟通效率,减少因术语误解而产生的问题。

2025-04-03

短视频平台调研报告.pptx

调研报告PPT制作,共15张幻灯片,涵盖以下内容: 章节 内容要点 封面 主流短视频平台差异化优势与发展路径调研报告 研究框架 六大研究模块概览 研究背景 调研目的、范围与平台选择 平台概览 五大平台DAU/MAU/定位/优势对比表 用户规模 DAU与MAU可视化对比分析 用户画像 各平台性别/年龄/城市分布特征 内容生态 内容类型、时长、特色对比 推荐机制 算法逻辑差异分析 商业化模式 变现方式与电商GMV对比 代表案例 东方甄选、辛巴家族、罗翔、完美日记等 差异化总结 核心竞争力与增长路径对比 成功经验 六大关键成功要素提炼 未来趋势 AI赋能、内容精品化、全域电商、私域精细化 策略建议 平台选择、内容策略、运营方法、商业化路径 结语 感谢聆听

2026-05-18

AI 编程进阶:构建零干预的代码生成自愈流水线

还在每天对着大模型生成的错误代码反复纠错?受够了 AI 编程时的“环境崩溃”与“逻辑幻觉”? 本次分享不讲虚无缥缈的 Prompt 提示词玄学,而是直接拆解一套真正在生产线落地的 AI Code Agent 闭环架构。我们将跳出“单向代码生成”的局限,探讨一种让机器自主感知、执行并纠错的工程化思路。 在本次分享中,我们将一起探讨: 上下文感知:如何通过代码静态扫描提前排雷,从根本上消除大模型的幻觉? 闭环自愈机制:如何搭建一个“运行-报错-截取-重试”的自治流水线,让机器自己看懂报错并修复缺陷? AI 的能力边界:直击大模型面对高耦合复杂代码时的“灾难现场”,这又将给我们带来怎样的架构演进启示? 来看看我们如何通过这套 Agent 流水线,用 3 分钟跑完人工半天的工作量,并达到 97.8% 的一次性通过率!用算力解放人力,让工程师聚焦更高价值的架构思考。

2026-05-19

OpenClaw与Agent Skills

OpenClaw:GitHub史上增速最快的开源项目,真正能做事的AI,是一款运行在您自己的设备上的个人AI助手,它可以通过你常用聊天软件回复你。

2026-03-11

⾦融领域⼤模型产品综合分析报告.pdf

内容概要:本报告对2024-2026年中国金融领域大模型产品进行综合分析,涵盖阿里云通义千问、百度文心一言、商汤日日新、蚂蚁金融大模型及BloombergGPT等主流产品。报告指出市场呈现“一超多强”格局,阿里云以33.2%份额领跑,百度、商汤紧随其后,应用场景从智能客服向投研、风控等核心业务延伸。标准化产品和MaaS模式成为主流,招投标数据显示应用类项目占比首次超过算力采购。技术趋势上,多模态、Agentic AI、国产化适配加速发展。 适合人群:金融机构决策者、科技厂商战略负责人、AI投资机构分析师。 使用场景及目标:①评估主流金融大模型的技术能力与市场定位;②制定金融机构AI战略部署路径;③识别投资方向与生态合作机会。 阅读建议:重点关注市场份额、技术能力雷达图与标杆案例对比,结合自身机构类型(如大行、券商、中小金融机构)参考相应的实施建议与竞争策略。

2026-03-04

阿⾥云通义千问⾦融⼤模型深度调研报告.pdf

综合分析报告包含: 执行摘要 - 市场格局、核心洞察、战略建议 第一章 - 金融大模型市场概览(规模、招投标、产品形态) 第二章 - 主要产品深度分析(5大产品详细对比) 第三章 - 用户体量与应用场景对比 第四章 - 竞争格局与优劣势分析 第五章 - 结论与建议(对金融机构、厂商、投资者的建议)

2026-03-04

基于昇腾MindSpeed-LLM的大模型训练&推理

基于昇腾MindSpeed-LLM的大模型训练&推理

2026-02-09

基于PyTorch-VLM的大模型训练&推理

基于PyTorch-VLM的大模型训练&推理

2026-02-09

新一代金融终端-FinceptTerminal.pptx

我们正处在一个由 AI 驱动的金融变革时代,传统的金融终端正在被颠覆。你是否好奇,下一代的金融终端是什么样子?AI 又将如何深度赋能我们的投资决策? 本课程将带你走进 Fincept Terminal 的世界,这不仅是一款工具,更是下一代金融智能终端的缩影。它将强大的 AI 能力与专业的金融分析融为一体,旨在重新定义我们与金融市场的交互方式。

2026-02-03

B2B-AI 2025部门分享分析报告

B2B-AI 2025部门分享分析报告

2026-01-22

人工智能基于云原生的AI Agent基础设施:金融领域大模型多模态应用加速落地方案设计

内容概要:本文系统阐述了AI云原生作为数智化时代AI Agent加速落地的最佳技术路径。AI云原生融合“AI+云原生”,以容器、微服务、Kubernetes等技术为基础,围绕大模型应用的算力调度、模型开发部署、多模态数据处理等需求重构基础设施架构,解决传统云计算在Token调用量激增、推理成本高、Agent安全执行等方面的挑战。文章详细介绍了AI云原生的技术框架,涵盖AI计算(异构GPU/CPU管理)、AI存储(分布式存储、Fluid/Alluxio缓存)、AI网络(RDMA、RoCE、InfiniBand低延迟通信)、AI容器(K8S编排与管理)以及AI作业(Kubeflow、Volcano等全生命周期管理),并提出通过GPU池化、弹性训练、安全可观测性等手段提升AI应用的效率、安全与成本控制。; 适合人群:具备一定云计算、AI开发或系统架构经验的技术人员,尤其是从事AI平台建设、大模型训练与推理、云原生技术落地的研发与运维人员;企业技术决策者亦可参考其战略方向。; 使用场景及目标:①构建支持大规模AI模型训练与推理的云原生基础设施;②实现AI应用的高效部署、弹性扩缩容与成本优化;③提升AI系统的安全性、可观测性与运维自动化水平;④探索金融等行业垂直领域的AI Agent落地解决方案; 阅读建议:此资源兼具战略视野与技术深度,建议结合Kubernetes、容器化、分布式系统等基础知识进行深入研读,并关注文中提及的开源项目(如Fluid、Kubeflow、Alluxio等)以辅助实践。

2025-11-10

容器编排基于Kubernetes的调度器架构与扩展机制研究:集群资源分配优化及异构算力调度实践

内容概要:本文深入讲解了Kubernetes集群调度机制及其扩展能力,重点介绍kube-scheduler的核心功能与调度流程,包括调度队列、过滤与打分、绑定等关键步骤。文章进一步对比了两种调度扩展方式:scheduler extender和scheduler framework,详细阐述其工作原理、配置方式与优缺点。并通过HAMi实例展示了如何基于extender实现异构算力(如GPU)的精细化调度,涵盖资源注册、过滤、打分、绑定全过程,体现调度器在真实场景中的可扩展性与工程实践。; 适合人群:具备Kubernetes基础知识,从事容器平台开发、运维或SRE工作1年以上的技术人员;对调度机制感兴趣的研发人员。; 使用场景及目标:①理解Kubernetes调度器的工作原理与核心流程;②掌握scheduler extender和scheduler framework的使用与选型依据;③学习如何实现GPU等特殊资源的自定义调度方案,提升资源利用率与调度灵活性。; 阅读建议:建议结合Kubernetes官方文档与源码对照阅读,重点关注调度框架的扩展点接口设计与HAMi中Filter、Bind、Allocate的协同逻辑,动手搭建实验环境验证扩展机制的实际效果。

2025-11-10

语言模型幻觉的根源剖析:从统计必然到评估体系的系统性困境

语言模型幻觉的根源剖析:从统计必然到评估体系的系统性困境

2025-10-20

这篇论文《Real-Time Detection of Hallucinated Entities in Long-Form Generation》提出了一种实时检测大语言模型在生成长文本时产生幻觉实

内容概要:本文提出了一种低成本、可扩展的实时检测长文本生成中幻觉实体的方法,聚焦于命名实体(如人名、日期、引用)级别的错误识别,而非完整的事实性判断。作者构建了一个自动化标注流程,利用具备网络搜索能力的前沿大模型对生成内容中的实体进行真实性验证,并生成带有支持或虚构标签的精细数据集。基于此数据,训练简单的线性探针即可高效识别幻觉实体,在多种700亿参数的大模型上实现了优于传统不确定性基线方法的性能(如Llama-3.3-70B上AUC达0.90),同时适用于短文本问答与数学推理等跨领域任务。研究还表明,一个模型上训练的探测器能有效泛化到其他模型,作者已公开数据集以促进复用。; 适合人群:从事自然语言处理、大模型安全与可靠性研究的研究人员及工程师,尤其是关注幻觉检测、模型校准和可信AI的技术人员。; 使用场景及目标:① 在医疗咨询、法律建议等高风险应用中实现实时监控,防止模型生成虚假信息;② 构建可干预系统,当检测到高幻觉风险时主动放弃回答以提升可靠性;③ 推动基于内部表征的轻量级检测方法,替代昂贵的外部验证流水线; 阅读建议:本研究强调了从实体级别切入进行细粒度标注的价值,建议读者重点关注其标注流程设计、探针训练策略以及跨模型泛化实验,同时注意其局限性,如标注噪声和仅覆盖部分幻觉类型,为后续改进提供方向。

2025-10-20

第八弹-Real-Time Detection of Hallucinated Entities in Long-Form Generatio-pro.html

第八弹-Real-Time Detection of Hallucinated Entities in Long-Form Generatio-pro.html

2025-10-20

第八弹-Why Language Models Hallucinate-pro

第八弹-Why Language Models Hallucinate-pro

2025-10-20

用嘴画图:AI 一句简介:还在为画图头疼吗? * 产品画流程图,排版半天; * 售前看到竞对一张好图,想拿过来,要一笔笔画; * 开发想要架构图,还得手动画 这次分享带你体验:一句话搞定架构图流程图

简介:还在为画图头疼吗? * 产品画流程图,排版半天; * 售前看到竞对一张好图,想拿过来,要一笔笔画; * 开发想要架构图,还得手动画。 这次分享带你体验:一句话让 AI 自动出图,流程图、架构图、时序图都能搞定。
从此,画图不再是负担,而是乐趣。

2025-09-16

【大模型微调】基于Qwen3-8B的人设定制化训练:金融领域Hithink角色构建与评测系统实现

内容概要:本文详细介绍了基于Qwen3-8B模型进行Hithink人设微调的完整流程,涵盖训练前的环境与模型选择、语料准备与强化、模型训练参数设置、训练过程监控、模型评测及优化方向。采用A100 40G单卡在Autodl云平台完成训练,使用Llama-Factory工具链进行微调,并通过人工评审方式对人设和功能表现进行评测。最终模型在人设测试中达到98.17%的通过率,在功能测试中通过率为86%。文章还总结了语料质量、多样性与评测方法对微调效果的关键影响。; 适合人群:具备一定大模型微调基础的研发人员、算法工程师,尤其是从事垂直领域人设定制或模型蒸馏相关工作的技术人员;适合工作1-3年并希望深入理解微调全流程的技术从业者。; 使用场景及目标:①掌握如何针对特定人设(如企业AI助手)构建高质量微调语料集;②学习在显存受限条件下合理配置训练参数(如梯度累积、学习率等);③了解人工评测与自动化评测的优劣对比,提升模型评估准确性。; 阅读建议:此文档强调语料质量和评测严谨性,建议读者结合实际项目参考其语料分类、扩写与测试集构建方法,并重点关注训练参数设置与问题分析部分,用于指导真实场景下的模型微调实践。

2025-09-16

【大模型微调】基于LoRA算法的LLaMA-Factory框架在法律领域中文语料上的SFT微调实践与参数优化指南

内容概要:本文详细介绍了如何使用LLaMA-Factory框架在本地对大模型进行微调,基于LoRA算法和DeepSeek-R1-Distill-Qwen-1.5B基座模型。内容涵盖环境搭建、模型加载、数据集准备与配置、模型训练参数设置、训练过程执行、模型导出及关键微调参数解析。通过可视化界面操作和命令行结合的方式,指导用户完成从环境部署到模型优化的全流程,并提供了参数调整建议与实际训练示例,帮助理解学习率、训练轮数、梯度裁剪等关键因素对训练效果的影响。; 适合人群:具备一定深度学习基础,熟悉Python与Linux操作,从事AI模型开发或微调工作的研究人员或工程师,尤其是有本地微调大模型需求的技术人员; 使用场景及目标:①在有限算力条件下高效微调大语言模型;②掌握LoRA等参数高效微调技术的实际应用;③通过可视化界面与配置文件实现定制化训练流程;④理解微调过程中各超参数的作用与调优策略; 阅读建议:建议读者结合实际操作逐步跟随文档执行,重点关注数据集格式配置、参数设置与模型导出流程,同时通过日志与损失变化分析训练效果,建议在调试时使用小样本验证流程正确性。

2025-09-16

国家政务服务平台统一身份认证平台实施方案

国家政务服务平台统一身份认证平台实施方案

2025-05-08

Linux检查加固基线核查参考.pptx

Linux检查加固基线核查参考.pptx

2025-04-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除