“教练,我想打篮球“ —— 给做系统的同学们准备的 AI 学习系列小册

本文介绍了为系统工程师量身打造的AI学习教程计划,旨在填补系统与算法之间的理解和实践鸿沟。首个系列将聚焦于从零搭建AI应用,特别是使用CLIP构建文本-图片跨模态搜索服务。内容涵盖CLIP的工作原理、原型搭建、向量数据库部署、推理服务优化和数据压缩等,所有教程都将注重开源、系统角度和实用性。项目已在Towhee和Milvus开源项目中预准备,即将发布首篇文章。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

最近在读 Jeff Dean 的新作 Pathways ,心中又一次出现了这样的困惑:从前沿工作上看,系统工作与算法模型工作早就已经到了相互结合、缺一不可的状态。但近几年在做开源项目的过程中,和开发者、用户交流下来,最大的体会是系统工程师和算法工程师几乎总是离的很远。同学们彼此眼中的对方,大概是“洗草药炼丹的” vs “大力出奇迹抡大锤的”……

做系统的同学们想要深入跟进 AI 技术趋势,把大锤抡到算法同学的心坎儿里,并不容易。几乎所有学习资料都透着一股浓重的科研味道,太多的公式与理论,太少的工程与系统。

作为系统出身的 AI 爱好者,我们在做 [Towhee] (https://github.com/towhee-io/towhee) 与 [Milvus] (https://github.com/milvus-io/milvus) 两个开源项目的过程中一直在等待一个为系统人量身打造的 AI 教程,但一直没有这样的作品出现。

近期,我们计划自己动手进行一次尝试,做一套咱们系统人自己的 AI 学习教程。项目定位是开源,纯系统角度,落地,好玩。目前计划中的有三个系列,分别侧重应用实战、推理系统优化、前沿系统技术:

1、从零开始搭建 AI 应用

  • 应用 CLIP 搭建文本-图片跨模态搜索服务

  • 技术宅的浪漫:图片与视频二次元化!

  • 大规模图搜系统

  • 跨模态视频语义检索

  • 音乐版权检测实战(策划中)

  • 问答系统(策划中)

  • 没有人比我更懂如何高效浏览 Github :为 Github 构建开源项目检索与推荐系统(策划中)

  • 技术宅的浪漫:你的女神总是缺一个口红色号!(策划中)

2、构建你自己的高性能推理服务

  • 初识 TorchScript ,ONNX ,TensorRT

  • 基于 Nvidia 的工具包加速你的推理服务

  • Towhee 推理服务构建实战 (策划中)

3、AI 系统论文精读

  • Pathways: Asynchronous Distributed Dataflow for ML

接下来即将和大家见面的系列文章是 《从零开始搭建 AI 应用:应用 CLIP 搭建文本-图片跨模态搜索服务》,预计本周发布。在这个系列中,将会学到:

  • CLIP 跨模态搜索的基本工作原理

  • 文本-图片跨模态搜索的原型搭建

  • 进阶 1:部署向量数据库,进行大规模向量召回

  • 进阶 2:部署推理服务,大幅提升推理性能

  • 进阶 3:向量数据压缩

为了最大化提高教程的流畅度,我们目前已经在 [Towhee] (https://github.com/towhee-io/towhee) 项目中完成了一系列准备工作,包括 CLIP 的集成封装,python 侧的 pipeline 编程接口,贴近生产实战的 docker 镜像,干货满满,敬请期待!

更多项目更新及详细内容请关注我们的项目 https://github.com/towhee-io/towhee ,您的关注是我们用爱发电的强大动力 :)


Zilliz 以重新定义数据科学为愿景,致力于打造一家全球领先的开源技术创新公司,并通过开源和云原生解决方案为企业解锁非结构化数据的隐藏价值。

Zilliz 构建了 Milvus 向量数据库,以加快下一代数据平台的发展。Milvus 数据库是 LF AI & Data 基金会的毕业项目,能够管理大量非结构化数据集,在新药发现、推荐系统、聊天机器人等方面具有广泛的应用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值