大模型-大模型答疑

静能生慧

已于 2024-06-11 11:31:29 修改

阅读量124

点赞数 1

分类专栏：大模型文章标签：大模型

于 2024-05-30 18:50:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sgliquangang/article/details/139332104

版权

大模型专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1、参考文章

https://dtzed.com/institute/2024/04/10341/

2、人工智能基础知识学习

人工智能顶级名字解释：

人工智能
- 机器学习
  - 深度学习
    - 生成式AI、大模型

人工智能原理：

实际使用、推理过程：一次前向计算
训练过程：
- 搭建模型结构
- 准备模型数据
- n次迭代过程（以下为一次迭代）：
  - 前向计算
    - 各层神经网络依次计算得出结果
      - 向量矩阵运算
      - 非线性变换
  - 损失函数计算
    - 确认本次前向计算结果与目标之间的差值
  - 反向传播
    - 通过链式法则求导，计算各层梯度
  - 更新节点
    - 基于梯度的数值优化参数求解，运用随机梯度下降（SGD）来更新神经网络各层节点
训练收敛：神经网络逐渐拟合到训练数据的高维分布，损失函数逐渐降低

大模型训练资源：

130亿参数大模型需要>230GB显存（V10032GB*8）的硬件训练资源，约等于1亿参数对应接近2GB的训练资源准备，文心4.0基于万卡进行训练

模型训练要点

模型训练最好基于已有的较为成熟的模型之上进行训练，以保证最终效果，避免训练数据、模型结构等等因素造成的影响
举例，百度的paddlepaddle提供了诸多的包含预训练模型的端到端开发套件，比如PaddleNLP（自然语言处理套件）、PaddleMIX（跨模态大模型套件）、PaddleOCR（文字识别套件）

模型部署

根据模型能力要求，分为边缘端侧部署、服务器部署
边缘端侧部署：

部署场景
- 物联网场景
- 移动端场景
部署要求：
- 模型结构轻量化处理、模型压缩
  服务端部署：
- 业务层模块
- 独立服务

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
大模型-大模型答疑

1、参考文章。
复制链接

扫一扫

专栏目录

静能生慧 CSDN认证博客专家 CSDN认证企业博客

码龄12年

371: 原创

6万+: 周排名

6530: 总排名

29万+: 访问

: 等级

6782: 积分

878: 粉丝

921: 获赞

50: 评论

844: 收藏

私信

关注

热门文章

分类专栏

大模型 5篇
后端 4篇
中间件、工具 16篇
办公 8篇
算法 23篇
Java 42篇
产品 1篇
区块链 1篇
Linux 11篇
数码 2篇
C、C++ 2篇
编程基础 1篇
前端 1篇
iOS 151篇
python 1篇

最新评论

Java-设计模式
倾听一世，繁花盛开: 写的太完美了，互关一下吧
codeblock couldn‘t create project directory ：path
普通网友: 引领技术潮流，是不可多得的好文，十分值得借鉴和参考。期待博主未来能够持续分享更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
iOS 数据库升级
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
iOS 数据库升级
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
iOS runtime
普通网友: 大佬高质量文章，图文并茂，逻辑清晰，受益匪浅，期待大佬新作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。