AI菜鸟向前飞 — 基础知识篇

前言

主要介绍最最基础的知识,在这个基础上有现在比较流行的GPT、Llama、Gemini等一系列大模型的出现,打好基础才能更理解上面是如何运作以及实现的过程。

PS:本篇科普不会介绍梯度下降算法(偏导数)等复杂的过程,先只会点到为止。

生命周期

  • 建模(Modeling)

        建模是设计深度学习模型的过程,包括选择适当的网络架构。

        在此阶段,你需要确定的网络层数,每层的节点数、激活函数类型、优化器以及损失函数等。

  • 训练(Training)

        训练阶段是深度学习模型学习并优化权重的过程。

        在此阶段,模型通过一组已标记的训练数据进行学习。这个过程在训练数据集上反复运行,直到模型的性能达到满意的程度或者达到预定的迭代次数,其中包含:有监督学习、无监督学习、半监督学习。

  • 验证(Validation)

        验证阶段通常在训练过程中进行,其目的是评估模型对未见过的数据的泛化能力。

        在此阶段,模型在一个独立的,非训练数据集(验证集)上进行测试。验证过程帮助我们调整模型参数,并决定何时停止训练。

  • 推理(Inference)

        推理阶段是模型部署后的阶段,也就是模型在实际环境中作出预测的阶段。

        在此阶段,模型接收新的、未标记的数据,然后根据训练得出的模型做出预测,这些预测结果可以被用于各种应用。

算法

  • Transformer — 目前最火

        最开始起源于NLP领域,主要处理文本领域。现在最火的ChatGPT的底层就是使用的它。

  • CNN(卷积神经网络)

        主要处理图片数据,应用于计算机视觉领域(CV)。例如:图片识别、分割,目标检测、追踪,图片生成等等

  • RNN(循环神经网络)

        主要处理文本数据,例如:NLP。在GPT中 讲注意力机制中也会提到它。

  • GAN(生成对抗网络)

        它是一个生成模型,用于图片领域。例如:AI换脸、图片样式风格迁移,虚拟人物生成等等。

  • Diffusion Model(扩散模型)

        它也是一个生成模型,用于图片领域,强于GAN。

  • GNN(图神经网络)

        主要处理一些图数据,从中做一些特征提取和问题的回答。例如:社交网络关联关系图谱等。

  • DRL(深度强化学习)

        主要处理需要跟环境交互的算法。例如:处理在游戏中,游戏主角与游戏环境之间的交互的奖惩机制。

  • 9
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值