AI大模型开发架构设计(3)——如何打造自己的大模型

如何打造自己的大模型

1 新时代职场人应用AIGC的5重境界

  • 第一、简单对话 + Ctrl-C/V 结果:人人都行
  • 第二、Prompt Engineering:系统掌握 Prompt 提示词技能,赋能工作真正提效
  • 第三、把AIGC融入业务流程,指挥AIGC做复杂任务:掌握好 AIGC 技能、真正懂业务领域知识
  • 第四、拥有自己的大模型:懂大模型原理、基于开源大模型微调(Fine-tune)、有行业数据壁垒
  • 第五、参与设计训练大模型:OpenAI等大模型公司

思考:自己处于哪种境界?

2 人人需要掌握的大模型原理

职场人都能听懂的大语音模型的训练过程

image.png

  • 第一阶段:传统的有监督训练
  • 第二阶段:奖励模型
  • 第三阶段:运用奖励模型,一问一回答一打分,不断进行反馈迭代强化学习
职场人都能听得懂的大语言模型的Transformer推理过程
  • Transformer:在 Transformer 之前,最大的问题就是遗忘(记不住上下文信息)

image.png

  • Transformer:通过**注意力机制(Attention)**解决遗忘问题
    • The:第一个,前面没有关联
    • FBI:前面会关联 The
    • is:前面会关联 FBI
    • chasing:前面会关联 FBI、is

image.png

  • Transformer:整个流程设计(大模型的核心)——2017年提出

image.png

  • Transformer:Encoder 将输入“序列”中的信息提取出来

image.png

  • Transformer:Encoder-Attention 将重要信息提取出来

image.png

  • Transformer:Encoder-Attention 将重要信息提取出来,会有一些更复杂的计算细节

image.png

3 如何构建自己的大模型

需要具备三个方面的能力
  • Prompt Engineer(提示词工程)
  • LangChain(一个框架的名字)
  • Fine-tuning(微调)
LangChain是什么?
  • 面向大模型的开发框架
  • 简单实现复杂功能的 AIGC 应用
  • 多组件封装

image.png

  • LangChain 推荐资料:https://wx.zsxq.com/dweb2/index/topic_detail/211842521158511
LangChain主要功能

image.png

LangChain核心组成
  • 组件
  • 封装
  • 模块

image.png

  • LangChain 核心组成:I/O模块
    • Prompts:主要管理、协助构建送入 Model 的输入
    • Language Modes:用何种 Model
    • Output parsers:解析输出结果

image.png

  • LangChain 核心组成:I/O模块流程
    • Prompts:归一化
    • Language Modes:预测
    • Output parsers:归一化

image.png

  • LangChain 核心组成:数据链路(Data Connection)模块
    • Source:支持各种异构数据源
    • Load:加载
    • Transform:变换
    • Embed:向量化
    • Store:存储向量数据库
    • Retrieve:检索

image.png

  • LangChain 核心组成:数据链路(Data Connection)模块——Load

image.png

  • LangChain 核心组成:数据链路(Data Connection)模块——Transform

image.png

  • LangChain 核心组成:数据链路(Data Connection)模块——Embed

image.png

  • LangChain 核心组成:数据链路(Data Connection)模块——Embed-相识度核心原理(“向量”距离)

image.png

  • LangChain 核心组成:数据链路(Data Connection)模块——Vector Store

image.png

image.png

  • LangChain 核心组成:记忆(Memory)模块,针对多轮对话强相关

image.png

image.png

image.png

image.png

  • 22
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
随着人工智能技术的不断发展,AI模型的应用开发成为了当前最热门的趋势之一。AI模型具有强大的计算能力和深度学习算法,能够处理复杂的任务和大规模的数据。在实际的应用开发中,我们需要掌握一些实战指南来更好地利用AI模型。 首先,我们需要明确自己的应用需求和目标。AI模型功能强大,但并不是对所有的应用都适用。因此,我们需要针对具体的应用场景来选择合适的AI模型,确保其能够满足我们的需求。 其次,我们需要具备一定的技术能力和知识。AI模型的应用开发涉及到深度学习、神经网络等高级技术,因此需要有一定的编程能力和算法知识。同时,我们还需要了解AI模型的特点和使用方法,对其进行深入的学习和研究。 另外,我们还需要关注数据的质量和数量。AI模型的训练需要大量的数据支持,因此我们需要具备数据收集、清洗和标注的能力,以及对数据进行合理的管理和利用。 最后,我们需要进行系统的测试和优化。在应用开发的过程中,我们需要不断地进行测试,发现问题并进行调整和优化,以确保AI模型的稳定性和性能。 总的来说,AI模型应用开发需要我们具备综合的技术能力和知识,同时需要结合具体的应用需求和场景,进行系统的规划和实施,从而更好地利用AI模型的优势。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

讲文明的喜羊羊拒绝pua

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值