自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 人、Agent、大模型 学习笔记

以后,除了人与大模型之间的问答式交互,可能更为复杂的一些任务,都需要借助Agent来实现人与大模型之间的多轮复杂任务交互,尤其是需要多层记忆,借助数据库的场景,就必须依赖Agent了

2026-04-28 21:33:55 284

原创 利用AI Agent搭建RAG系统

借助AI Agent实现一个RAG系统的全过程记录,体验一下AI自动编程

2026-04-04 16:53:35 345

原创 AI Agent 开源软件txtai的RAG实践之一

AI Agent 开源软件txtai的RAG实践之一

2026-02-25 21:41:59 658

原创 Linux内核是如何对外提供服务的?

Linux内核通过系统调用接口(System Call Interface)对上面的用户态程序提供支持。但是我们实际编程的时候,很少会直接使用系统调用接口,那是因为glibc库已经基于系统调用接口封装好了更容易调用的glibc提供的库函数api。

2026-02-12 12:06:48 945

原创 为什么说Linux内核是宏内核?

在AI时代,还需要了解操作系统的相关知识吗?我觉得很有必要,尤其是现在AI Agent的发展,需要对操作系统、虚拟化及容器、包管理等各种技术有深入的了解,才能对AI Agent实现的基础设施有个大概的认识。

2026-02-05 22:04:56 741

原创 AI系统的Scale Up与Scale Out

说明Scale Up与Scale Out系统的区别,并重点介绍当前AI系统的Scale Up最大系统,以及进一步进行Scale Out的方式。对比了内部总线和网络互联的差异等。

2026-01-09 22:23:32 1005

原创 CES 2026 nvidia 主题演讲技术总结

本次CES 2026主题演讲,除了发布新的Rubin,提出物理AI全栈方案之外,还有3个关键信息:Nvidia现在除了芯片之外,还做全栈的AI系统,且开源,以方便其他人在这个基础上进一步开发自己的AI系统MultiModel多模型协作Bluefield在AI存储KV context保存方向上的创新,避免了context的来回搬移

2026-01-08 20:42:25 869

原创 IB、RocE、RDMA、TCP/IP:Scale-Out的基础

介绍分布式系统Scale Out的起源、IB和RDMA逐渐发展,RoCE后续加入的过程,推动更快的Scale Out系统的发展

2025-12-18 11:58:48 699

原创 NVLINK比PCIe快很多,但定位不是取代PCIe

介绍nvidia的NVLINK与业界标准总线PCIe,并描述其中的关系

2025-12-09 12:53:48 991

原创 GPU Core与Tensor Core的区别

讲讲GPU Core与Tensor Core之间的区别,以及为什么要这样设计

2025-11-22 17:15:24 677

原创 CUDA技术壁垒之我见-2

在上一篇文章的基础上,继续介绍了CUDA运行时、并发调度和Stream的关键概念

2025-11-10 09:00:01 719

原创 CUDA技术壁垒之我见

摘要:CUDA技术壁垒之我见1. CUDA-X库的api设计体现了对该领域业务的深刻理解,方便使用;2. CUDA-X库的底层是靠CUDA来支持的,CUDA是基于并行计算全新设计的体系;3. CUDA在各个芯片上的支持都是兼容的,这需要一开始就规划好;4. CUDA软件与主流framework已经深入融合,直接可用。

2025-10-31 19:55:15 1041

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除