自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(287)
  • 资源 (64932)
  • 收藏
  • 关注

原创 AI 智能体时代的上下文工程剖析

摘要:Anthropic最新提出的"上下文工程"标志着AI应用开发从提示词工程向动态信息管理的范式迁移。上下文包括系统提示、对话历史、工具调用等模型可见的所有信息,其核心挑战在于如何在有限注意力预算内优化信息流。博客提出四项设计原则:精简系统提示、高效工具交互、精选少样本示例和按需检索,并针对长周期任务推荐压缩、结构化笔记和多智能体架构三种策略。随着模型能力提升,上下文工程将推动AI系统向更自主的信息管理方向发展,但其核心始终是最大化有限上下文资源的信号价值。

2025-12-06 23:43:39 833

原创 大模型推理基础设施的技术挑战与应对策略

摘要:大模型推理已成为算力需求的核心驱动力,对基础设施提出严峻挑战。当前面临四大痛点:1) 计算环节存在算子效率低、架构压力大等问题;2) 传输环节带宽利用率不足且通信开销高;3) 存储环节容量需求激增、性能受限;4) 调度环节资源利用不均衡。解决方案采用"算传存调结合+软硬件协同"思路,通过深度优化计算、分层通信、近存计算和智能调度等技术,实现推理性能显著提升:吞吐量提升3.2倍,时延降低72%。最终形成训推一体基础设施和推理一体机两大产品矩阵,支撑大模型规模化落地。

2025-11-09 19:58:26 823

原创 英伟达发布新推理GPU-Rubin CPX!100TB大内存,单机架AI性能暴涨6500%,长上下文推理的利器

英伟达推出全新专用GPU RubinCPX,专为长上下文推理和视频生成设计。该芯片配备128GB GDDR7内存,NVFP4精度下算力达30PFLOPS,相比现有系统提供3倍更快的注意力机制。集成144张RubinCPX的VeraRubinNVL144CPX平台单机架性能达8EFLOPS,内存带宽1.7PB/s,是Blackwell Ultra系统的7.5倍。RubinCPX采用经济型单芯片设计,与旗舰GPU协同工作,优化分解式推理流程,特别适合处理超百万token的长文本和视频任务。英伟达预计该平台可实现

2025-09-10 08:53:04 841

原创 DeepSeek大模型的发展的十问十答

针对DeepSeek大模型的简介,以及常用问题十问十答

2025-02-10 21:25:59 1214 1

原创 国内AI芯片厂商的计算平台概述

国内AI芯片厂商的计算平台概述-昇腾、海光、天数智芯、寒武纪、燧原

2025-01-29 18:38:38 3239

原创 揭秘AI智算中心网络流量:大模型训练的背后技术与挑战

AI智算中心的网络流量设计

2025-01-19 15:00:00 2031

原创 多模态大语言模型技术进展

多模态大语言模型最新进展

2025-01-14 09:54:05 956

原创 大模型思维链推理的进展、前沿和未来分析

大模型思维链推理的综述:进展、前沿和未来

2025-01-07 22:08:26 1728

原创 大模型训练的数据解读

大模型技术讲解:大模型训练的数据

2025-01-03 10:53:30 773

原创 大模型国产化迁移大模型到昇腾教程(Pytorch版)

大模型国产化适配10-快速迁移大模型到昇腾910B保姆级教程(Pytorch版)

2025-01-03 10:46:03 1851

原创 大模型的开发训练与推理部署解读

大模型的开发训练与推理部署白皮书

2025-01-03 10:33:01 1283

原创 大语言模型LLM技术报告

大语言模型:LLM技术报告

2024-12-30 09:43:23 521

原创 开源智能工业软件技术发展分析

开源智能工业软件技术白皮书

2024-12-25 08:56:49 1761

原创 弱电设计的网络基础知识

弱电设计——网络基础知识

2024-12-23 15:46:07 863

原创 使用RDMA技术构建无损网络

如何使用RDMA构建无损网络?

2024-12-23 15:38:14 1237

原创 微服务常用的中间件及其用途

微服务常用的中间件有哪些?都有什么用途?

2024-12-23 15:13:22 1531

原创 微服务系统架构设计参考

微服务系统架构设计参考

2024-12-17 11:11:13 1096

原创 搭建10万卡GPU集群技术指南

手把手教你搭建10万卡GPU集群

2024-12-17 10:39:28 1920

原创 数据中心的网络架构设计指南

数据中心的网络架构设计指南

2024-12-12 10:56:46 1987

原创 智算网络中Scale-out和Scale-up网络的技术原理

智算网络中Scale-out网络和Scale-up网络的本质区别是什么?

2024-12-12 10:46:35 3847

原创 在国产GPU上体验大模型Grok-1

Grok-1的激活参数数量为860亿,表明其在处理语言任务时的潜在能力强大,同时使用旋转嵌入位置编码,这是一种处理序列数据的方法,可以提高模型处理长文本的能力,上下文长度最大支持8192个tokens。在海光DCU上运行Grok-1模型,不仅展示了其卓越的计算性能,还证明了国产GPU在大语言模型领域的巨大潜力。Grok-1是马斯克旗下的xAI公司开源的大语言模型,参数量达到了3140亿,远超OpenAI GPT-3.5的1750亿,是迄今为止参数量最大的开源大模型。1# 1.拉取docker镜像。

2024-12-10 13:17:52 1120

原创 人工智能大语言模型技术发展研究洞察

人工智能大语言模型技术发展研究报告!

2024-12-10 13:08:08 1596

原创 360智算中心万卡GPU集群架构分析

360智算中心:万卡GPU集群落地实践

2024-12-08 10:08:47 1578

原创 AI PC处理器ARM架构-引入NPU和大模型

AI PC处理器架构变化:ARM低功耗、引入NPU和大模型

2024-12-04 21:56:44 1789

原创 AI智算中心-节点内外网络互连方案

AI智算中心网络互联:节点内外方案大揭秘

2024-12-01 13:39:05 1305

原创 AI服务器从HBM到CXL的技术变革

AI服务器从HBM到CXL变革

2024-12-01 13:31:56 1308

原创 十万卡GPU AI算力底座集群解决方案

AI算力底座:十万卡GPU集群解决方案

2024-11-29 21:19:33 1425

原创 AMD的AI芯片Instinct系列介绍

AMD最强AI芯片发布!

2024-11-29 21:05:39 1259

原创 AI服务器核心部件产业链升级分析

AI服务器核心部件产业链剖析(2024)

2024-11-25 11:46:13 1099

原创 高带宽内存 (HBM)技术终极指南

高带宽内存 (HBM): 终极指南

2024-11-25 09:51:18 3665

原创 鲲鹏CPU软件性能调优方案

鲲鹏CPU软件性能调优(精编版)

2024-11-21 20:19:52 550

原创 Blackwell GB200-英伟达AI服务器架构介绍

Blackwell GB200:英伟达GPU重塑AI服务器

2024-11-21 17:03:07 2857

原创 英伟达AI超大规模组网平台方案

英伟达GPU:AI超大规模组网

2024-11-19 19:10:56 993

原创 GPU分布式通信技术-PCle、NVLink、NVSwitch深度解析

GPU分布式通信技术-PCle、NVLink、NVSwitch

2024-11-17 10:52:30 3277

原创 构建安全可靠的人工智能数据中心的关键因素

深度:如何构建人工智能数据中心?

2024-11-17 10:38:29 1065

原创 英伟达Tensor Core技术架构原理分析

英伟达Tensor Core架构技术原理

2024-11-16 11:26:11 1295

原创 人工智能英伟达越来越“大”的GPU

英伟达:让我们遇见越来越“大”的GPU

2024-11-16 11:21:32 1112

原创 超算中心典型网络组网拓扑分析

超算网络常见组网拓扑分析

2024-11-16 11:16:27 2180

原创 软件技术架构风格与应用场景分析

软件架构技术:常见架构风格与应用场景

2024-11-14 15:35:22 1328

原创 软件架构与模式分析

软件架构模式分析

2024-11-12 16:00:42 344

挖掘机调度中的人工智能应用研究.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

康复医学与人工智能融合.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

技术推广服务中人工智能的应用探讨.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

戴尔电脑在人工智能领域的应用探索.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

教育公平与人工智能伦理的融合.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

数字内容版权运营中的人工智能应用研究.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

教育科技与人工智能融合研究.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

探索人工智能与奇检验的结合.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

教育人工智能关键技术.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

探究间接地址与人工智能的结合应用.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

探讨人工智能在促进工作生活平衡中的应用.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

循环队列与人工智能在金融行业的结合.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

指令字在人工智能领域的应用探索.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

探讨SSH在人工智能领域的安全性问题.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

张子和领域人工智能的挑战与机遇.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

探讨如何通过人工智能提高银行卡交易的安全性.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

教育大数据与人工智能融合.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

微创手术导航系统与人工智能结合.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

教育科技赋能幼儿园-人工智能与教育融合研究.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

教育人工智能与教师角色转变.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

服装行业人工智能技术应用.docx

人工智能解决方案

2025-12-05

法学人工智能应用.docx

人工智能解决方案

2025-12-05

电影产业人工智能辅助创作研究.docx

人工智能解决方案

2025-12-05

翻译与人工智能的深度融合.docx

人工智能解决方案

2025-12-05

教育公平视角下的人工智能伦理问题探讨.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

心律疾病人工智能诊断.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

教育公平与人工智能伦理的发展趋势分析.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

教育科技与人工智能的深度整合.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

教育公平与人工智能伦理的互动关系研究.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

情感分析在人工智能伦理审查中的应用.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

影视大数据与人工智能融合.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

形式化布局与人工智能结合.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

心理健康与人工智能前沿技术.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

心理健康与数字化捐赠行为-基于人工智能的分析.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

教育公平视角下的人工智能伦理问题研究.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

教育公平中的技术驱动-人工智能在教育资源分配中的作用.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

心理评估与人工智能结合.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

意识的人工智能模拟.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

形式逻辑在人工智能领域的进展.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

微流体与人工智能交叉融合的创新研究.docx

人工智能行业相关的应用趋势和解决方案介绍

2025-12-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除