动手学大模型应用开发-03

最新推荐文章于 2024-08-24 09:14:07 发布

ThomsXiong

最新推荐文章于 2024-08-24 09:14:07 发布

阅读量96

点赞数

文章标签：人工智能 python 架构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ThomsXiong/article/details/134498230

版权

笔记根据20231119日学习整理，参考DataWhale社区的学习资料

1. 大模型开发流程 (datawhalechina.github.io)https://datawhalechina.github.io/llm-universe/#/C3/1.%20%E5%A4%A7%E6%A8%A1%E5%9E%8B%E5%BC%80%E5%8F%91%E6%B5%81%E7%A8%8B今天主要是学习大模型开发的流程和架构。基于学习整理一些观点和流程可供参考：

一、大模型开发是一个工程问题

基于大模型底座（API或者开源模型)使用Prompt工程解决业务问题

二、传统AI开发和大模型AI开发的区别

传统AI开发：拆解业务+子业务训练数据和验证数据+整合模型链路
大模型AI开发：大模型底座+若干个prompt业务
1）实现效果:将传统的模型训练调优转变成了更简单、轻松、低成本的 Prompt 设计调优

2）大模型封装了机器学习的过程（预训练模型）+业务通过prompt

补充：机器学习的流程
1、获取数据（样本和特征，行列）
2、数据基础处理（预处理）
3、特征工程
***数据和特征决定了机器学习的上限，模型和算法只是逼近上限而已。
特征提取、特征预处理、特征降维
4、模型训练
5、评估模型

三、大模型开发的整体流程

这个开发流程我是结合项目管理实践的内容来重新梳理了下，可以对比教程来一起看

1、需求（业务痛点或者idea，可以出一个简单的需求说明）
基于大模型的个人知识库助手
2、设计（功能设计+架构设计（技术架构和数据架构））
1）功能设计：上传文档、创建知识库；
选择知识库，检索用户提问的知识片段；
提供知识片段与提问，获取大模型回答；
流式回复；
历史对话记录
2）技术架构：
Langchain+Chroma知识库+前后端使用 Gradio 和 Streamlit
3、环境搭建（服务器和数据库）
Chroma知识库
4、开发（核心功能开发+前后端开发）
Embdding API 的调用及封装、Langchain调用API+
5、测试（开发测试+用户测试）
6、上线

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
动手学大模型应用开发-03

1）实现效果:将传统的模型训练调优转变成了更简单、轻松、低成本的 Prompt 设计调优。今天主要是学习大模型开发的流程和架构。2）大模型封装了机器学习的过程（预训练模型）+业务通过prompt。***数据和特征决定了机器学习的上限，模型和算法只是逼近上限而已。传统AI开发：拆解业务+子业务训练数据和验证数据+整合模型链路。2、设计（功能设计+架构设计（技术架构和数据架构））大模型AI开发：大模型底座+若干个prompt业务。二、传统AI开发和大模型AI开发的区别。4、开发（核心功能开发+前后端开发）
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。