2024 年学习 AI 路线图

本文详细规划了一条2024年的AI学习路径,涵盖了数学基础、编程工具(Python和PyTorch)、机器学习、深度学习、大型语言模型的构建与应用,以及如何保持学习更新的策略,为初学者提供了循序渐进的学习指南。
摘要由CSDN通过智能技术生成

想学习AI吗?但您不知道如何或从哪里开始?为了逃离教程地狱真的学习时,你必须亲自动手,从头开始编写算法,实现论文,并使用人工智能解决问题来完成有趣的副业项目。

img

  1. 自上而下的方法:首先是代码,然后是理论。
  2. 有很多东西需要学习,而且你永远学不完,尤其是在人工智能方面,当每周都会发布新的革命性论文和想法时。所以,你应该在公共场合学习。

一、数学

机器学习在很大程度上依赖于数学的三大支柱:线性代数、微积分、概率和统计学。每个都在使算法有效运行方面发挥着独特的作用。

  • 线性代数:用于数据表示和操作的数学工具包,其中矩阵和向量构成算法解释和处理信息的语言
  • 微积分:机器学习优化的引擎,使算法能够通过理解梯度和变化率来学习和改进。
  • 概率与统计:不确定性下决策的基础,允许算法预测结果并通过随机性和可变性模型从数据中学习。

这是从程序员角度来看的关于 ML 数学的精彩系列:通过权重和偏差进行机器学习的数学代码

如果您想要采用代码优先的方法来学习线性代数,请观看由 fast.ai 的创建者制作的计算线性代数视频代码)。

在课程旁边阅读《Python 应用机器学习的线性代数简介》 。

如果您想要更传统的东西,请观看伦敦帝国理工学院的讲座-线性代数多元微积分

观看 3Blue1Brown 的《线性代数精华》《微积分精华》

观看StatQuest 的统计基础知识了解统计数据

补充

二、工具

2.1 Python

初学者从这里开始:实用 Python 编程

如果您已经熟悉 Python,请执行此高级 Python 掌握

它们都是 Python Cookbook 的作者 David Beazley 的精彩课程。

之后,观看詹姆斯·鲍威尔的一些演讲

阅读Python 设计模式

补充

2.2 PyTorch

观看Aladdin PerssonPyTorch 教程

PyTorch 网站是一个很棒的地方。

用一些谜题测试你的知识

补充

三、机器学习

阅读100 页的机器学习书籍。

3.1 从头开始编写

当你阅读时,从头开始编写算法。

查看下面的存储库

如果您想要挑战,请按照本课程从头开始编写 PyTorch。

3.2 参加比赛

在比赛中应用您所学到的知识。

3.3 做副业项目

阅读Vicki Boykis 的《将机器学习运用到生产中》

她还写了她在构建Viberary(一种书籍语义搜索)时所学到的知识。

获取数据集并构建模型(即使用Earthaccess获取 NASA 地球数据)。

使用Streamlit创建 UI并在 Twitter 上分享。

3.4 部署模型

获取生产中的模型。跟踪您的实验。了解如何监控模型。亲身体验数据和模型漂移。

这里有一些优秀的资源

3.5 补充材料

四、深度学习

如果你想要自上而下,请从 fast.ai 开始。

4.1 fast.ai

喜欢 fast.ai?查看全栈深度学习

如果您想要更全面的传统课程,请查看François FleuretUNIGE 14x050 — 深度学习

如果您在某些时候需要接触理论,这些都是很棒的书。

在手机上阅读《深度学习小书》,而不是滚动 Twitter。

在您的神经网络收敛时阅读这些内容。

4.2 多参加一些比赛

4.3 论文实现

查看labml.ai 带注释的 PyTorch 论文实现

Papers with Code 是一个很好的资源;这是BERT在他们的网站上的解释。

以下是深度学习专业领域的一些资源

4.4 计算机视觉

很多人推荐CS231n:计算机视觉深度学习。这很有挑战性,但如果你能克服它,那就值得了。

4.5 强化学习

对于强化学习来说,这两个都很棒:

4.6 自然语言处理

斯坦福大学的另一门精彩课程,CS 224N |深度学习自然语言处理

学习拥抱脸:拥抱脸NLP课程

看看这个Super Duper NLP 存储库

好文章和细分

补充

五、大型语言模型

首先,观看Andrej 的[ 1 小时演讲] 大型语言模型简介。

然后是五个公式中的大型语言模型,作者:Alexander Rush — 康奈尔科技

5.1 观看神经网络:从零到英雄

它从从头开始解释和编码反向传播开始,到从头开始编写 GPT 结束。

神经网络:从零到英雄作者:Andrej Karpathy

他刚刚发布了一个新视频 →让我们构建 GPT Tokenizer

您还可以在 60 Lines of NumPy | 中查看GPT杰·莫迪,当你在做的时候。

5.2 免费LLM训练营

由 Full Stack Deep Learning 免费发布的付费LLM 训练 营。

它教授即时工程、LLMOps、LLM 的用户体验,以及如何在一小时内启动 LLM 应用程序。

现在你已经渴望在这个新手训练营之后进行构建了,

5.3 使用LLM构建

想要使用LLM构建应用程序吗?

观看Andrew Ng 的《[使用大型语言模型进行应用程序开发》

](https://nips.cc/virtual/2023/tutorial/73948)

阅读Huyen Chip 的《Building LLM applications for production》

以及构建基于法学硕士的系统和产品的模式,作者:Eugene Yan

请参阅OpenAI Cookbook了解食谱。

使用Vercel AI 模板开始使用。

5.4 参加黑客马拉松

lablab.ai每周都会举办新的人工智能黑客马拉松。如果你想组队请告诉我!

如果您想更深入地了解理论并了解一切是如何运作的:

5.5 阅读论文

Sebastian Raschka撰写的一篇关于理解大型语言模型的精彩文章,其中列出了一些您应该阅读的论文。

他最近还发表了另一篇文章,其中包含您应该在 2024 年 1 月阅读的论文,其中涉及米斯特拉尔模型。

关注他的子堆栈Ahead of AI

5.6 从零开始编写Transformer

阅读Transformer 系列 2.0 版 | Lil’Log的概述。

选择最适合您的格式并从头开始实施。

论文

博客

视频

您现在可以从头开始编写变压器代码。但还有更多。

观看这些斯坦福 CS25 — Transformers United视频。

5.7 一些不错的博客

5.8 观看奥马尔·贾米尔

他有精彩的深入视频解释论文。他还向您展示了代码。

还有一些与LLM相关的链接并不详尽。请参阅LLM课程大纲,了解更全面的LLM课程大纲。

5.9 了解如何运行开源模型。

使用ollama:在本地启动并运行 Llama 2、Mistral 和其他大型语言模型

他们最近发布了Python 和 JavaScript 库

5.10 提示工程

阅读提示工程 |莉尔洛格

ChatGPT 为开发人员提供提示工程,作者:Ise Fulford (OpenAI) 和 Andrew Ng

DeepLearning.ai 还提供其他可以免费报名的短期课程。

5.11 微调LLM

阅读Hugging Face 微调指南

一本好的指南:微调 — GenAI 指南

看看蝾螈

这是一篇好文章:使用直接偏好优化微调 Mistral-7b 模型 |作者:马克西姆·拉博纳

5.12 RAG

Anyscale 的一篇精彩文章:构建基于 RAG 的 LLM 应用程序用于生产

Aman Chadha检索增强生成的全面概述

六、如何保持更新

时事通讯 + 播客 + Twitter 的组合

如需论文,您可以关注AK (@_akhaliq)

对于播客,我发现最好的是Swyx 和 Alessio 的Latent Space

加入他们的Discord

他们还有这份时事通讯Smol Talk,总结了所有重大的人工智能分歧。

我喜欢的其他一些时事通讯是:

七、其他有用的课程/清单

来编写和组织这篇文章花了足够的时间,但它的回报却在递减,是时候学习和构建了。希望这对您的 AI 之旅有所帮助!

[1] https://medium.com/bitgrit-data-science-publication/a-roadmap-to-learn-ai-in-2024-cc30c6aa6e16#3352

  • 32
    点赞
  • 68
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
人工智能是一门涉及多个学科领域的综合性学科,学习人工智能需要具备一定的数学、计算机科学和统计学等基础知识。以下是一个人工智能专业学习的一般路线图: 1. 学习数学基础:人工智能需要用到很多数学知识,包括线性代数、概率论与数理统计、微积分等。这些数学基础对于理解和应用人工智能算法非常重要。 2. 学习编程和计算机科学基础:掌握至少一种编程语言,如Python或Java,并了解计算机科学的基本概念,如数据结构、算法和计算机网络等。 3. 学习机器学习:机器学习人工智能的核心技术之一。学习机器学习算法的原理和应用,包括监督学习、无监督学习、强化学习等。 4. 学习深度学习:深度学习是机器学习的一个分支,通过神经网络模型实现对大规模数据的学习和预测。学习深度学习的基本原理和常用的深度学习框架,如TensorFlow和PyTorch等。 5. 学习自然语言处理:自然语言处理是人工智能的一个重要应用领域,涉及到文本分析、语义理解、机器翻译等。学习自然语言处理的基本方法和技术。 6. 学习计算机视觉:计算机视觉是人工智能的另一个重要应用领域,涉及到图像处理、目标检测、图像识别等。学习计算机视觉的基本方法和技术。 7. 学习数据挖掘和大数据技术:数据挖掘是从大规模数据中发现模式和知识的过程,大数据技术是处理和分析大规模数据的方法和工具。学习数据挖掘和大数据技术的基本原理和应用。 8. 学习人工智能伦理和法律:人工智能的发展也带来了一系列伦理和法律问题,学习人工智能伦理和法律的基本原则和规范。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值