从零开始的Dify大模型应用开发指南

大模型相关目录

大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容
从0起步,扬帆起航。

  1. 大模型应用向开发路径:AI代理工作流
  2. 大模型应用开发实用开源项目汇总
  3. 大模型问答项目问答性能评估方法
  4. 大模型数据侧总结
  5. 大模型token等基本概念及参数和内存的关系
  6. 大模型应用开发-华为大模型生态规划
  7. 从零开始的LLaMA-Factory的指令增量微调
  8. 基于实体抽取-SMC-语义向量的大模型能力评估通用算法(附代码)
  9. 基于Langchain-chatchat的向量库构建及检索(附代码)
  10. 一文教你成为合格的Prompt工程师
  11. 最简明的大模型agent教程
  12. 批量使用API调用langchain-chatchat知识库能力
  13. langchin-chatchat部分开发笔记(持续更新)
  14. 文心一言、讯飞星火、GPT、通义千问等线上API调用示例
  15. 大模型RAG性能提升路径
  16. langchain的基本使用
  17. 结合基础模型的大模型多源信息应用开发
  18. COT:大模型的强化利器
  19. 多角色大模型问答性能提升策略(附代码)
  20. 大模型接入外部在线信息提升应用性能
  21. 从零开始的Dify大模型应用开发指南


Dify框架

用一句话介绍Dify,我想引用Dify官网的介绍。

比 LangChain 更易用。

众所周知,Langchin是大模型应用开发框架中较早、传播较广、功能集成较多的一个大模型应用开发框架,不少人的大模型研究工作都从langchain开始。

最近犹豫研发需求增加,开发难度提升,langchain框架的开发效率已经不太能满足公司研发团队需求,因此我们另辟蹊径,找到了Dify。

Didy是一个开源的 LLM 应用开发平台。提供从AI workflow 编排Agent 构建Prompt工程RAG 检索在线信息接入多模态能力接入模型管理等大模型性能提升技术,能够使开发者轻松引入COT回馈机制few-shot等大模型性能提升技巧,构建 生成式 AI 原生应用

可见,Dify已经能够比较全面地覆盖本系列文章之前提到的种种大模型开发技术和技巧,虽然与理想大模型平台有所差距【缺少数据侧模块(数据抓取、数据处理等功能点)和模型侧模块(微调数据集构建、模型微调等功能点)】,但在系统开发侧已经足够优秀。

尤其是,Dify的开发模型属于敏捷开发,可拖拽式构建大模型应用,上手门槛低、开发效率高。

使用示例

本文以一个在线数据引入和RAG项目为例,介绍Dify开发使用。

部署安装

Dify已于github开源

https://github.com/langgenius/dify

拉到项目后,根据项目教程用docker快速部署即可。

且需要根据项目教程配置环境参数。

基本功能

启动网页服务:
在这里插入图片描述
登陆账号
在这里插入图片描述
可见,dy开发十分简洁,主要功能有:
位于左上角的:空白应用开发、模板开发
位于页面中间顶部的:探索、工作室、工具
在这里插入图片描述
其中,从模板开发预定义如下:
在这里插入图片描述
可见典型的生成任务、知识库任务、智能体应用任务、工作流编排等等,Dify均提供了应用构建模板。
在这里插入图片描述
选择一个模板后顶一下应用名称和描述即可开始设计,如下图所示,其主要是分为节点和关联线两个部分,均可增删改。
在这里插入图片描述
比如节点增添可如下所示:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

模型配置

在开发大模型服务时,需为框架配置好可用的大模型服务。
入口在如下位置:
在这里插入图片描述
点击后可见界面如下:
在这里插入图片描述
可见,dify支持ollama、OpenAI API等等格式的 模型接入方式(可自行添加更多、自定义更多)。此外,不同模型推理框架还对应词嵌入模型、大语言模型、重排模型等等。最后,模型返回结果格式也和其加载框架有关。此处不多赘述。
本文采用OpenAI API格式的形式进行大模型接入(以kimi chat逆向为例)。
具体流程如下:
在本地部署kimi-free-api项目

https://github.com/LLM-Red-Team/kimi-free-api

按指令docker部署环境
在这里插入图片描述
在这里插入图片描述
在dify的OpenAI界面下配置相关参数
在这里插入图片描述
其中API KEY为kimi-free-api项目所提及的refresh_token,依据教程在kimi-chat页面F12开发者模式下即可获取。

注意,模型可用性检测

下述代码:

import requests
import json



# 定义发送请求的函数
def send_request(question):
    url = 'http://172.19.138.52:8000/v1/chat/completions'

    data = {
       "model": "kimi-test",
        "messages": [
            {
                "role": "user",
                "content": question
            }
        ],
        "conversation_id": "cnndivilnl96vah411dg",
        "use_search": 'true',
        "stream": 'false'
    }
    json_data = json.dumps(data)
    response = requests.post(url,
                             data=json_data,
                             headers={
                                 "Content-Type": "application/json",
                                 'Authorization': f'Bearer eyJhbGciOi'
                                      }
                             )

    response_text = response.text

    return response_text



# test
result = send_request('你好,请介绍一下大数据局?')
answer = result
print(answer)

上述代码配合linux上的docker api后台即可检测模型服务是否有用,如有用,则显示如下:
在这里插入图片描述

流程开发

本次设计总体流程如下:
在这里插入图片描述

易知道,本次设计主要是一个RAG结合在线信息检索的项目。具体地,大模型依据输入后知识库检索结果进行判断,检索到信息后输入给大模型进行总结,是一条典型RAG路径;若未检索到符合阈值要求的知识库信息,则传入谷歌搜索界面进行信息检索,将检索信息及初始query传入LLM进行总结,这是一条AI信息检索路径;最后若检索结果不合要求,服务则输出指定内容

知识检索节点

在全流程中,设计对知识库相关配置,如下:
在这里插入图片描述
从上图所示区域即可设定输入query变量及所需查询知识库、查询知识库模型。
预设知识库流程如下:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
分割策略需对具体数据集做适配,我个人推荐自定义模式配合数据处理脚本进行,此处不做赘述。
还要再写一份技术方案意思是还需要写一个正在研发的,还没有完成的。
在这里插入图片描述
此处我推荐向量检索形式,topk以及阈值自行根据问答效果进行适配。

分支节点

此处分支节点,即条件判断、代码执行以及问题分类器三个节点。
在这里插入图片描述
条件分支功能较为有限
在这里插入图片描述
代码执行完全可以利用python语言设计复杂的功能和逻辑判断
在这里插入图片描述
问题分类器则是依据大模型能力对问题进行分析选择不同地后续路径,其本质是Agent组的思想。需配置输入、分类以及所用模型。

模型节点

在这里插入图片描述
模型节点需配置所用模型、prompt、输入变量、是否多轮等参数,cot、few-shot等等技巧可在此进行应用。

HTTP节点

在这里插入图片描述
该节点可通过http请求实现附加功能。也可以通过对url post的方式实现对大模型的另一种功能引入。

最后

我们所开发的服务可以通过API或独立页面形式使用。
在这里插入图片描述
在这里插入图片描述
当然,回馈机制、复杂多角色工作流、agent组、可视化、多模态分析以及更丰度的大模型应用开发,Dify均可进行便捷实现,此处不一一列举。本文抛砖引玉,希望诸位能在大模型开发上做出更多有用的设计和尝试,谢谢!

  • 24
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
dify是一个开源的Python库,用于快速开发机器学习模型和部署机器学习服务。它提供了一系列的工具和接口,帮助开发者在机器学习项目中更高效地进行数据处理、特征工程、模型训练和模型部署等任务。 dify的主要特点包括: 1. 简单易用:dify提供了简洁的API和丰富的功能,使得开发者可以快速上手并进行高效的开发。 2. 模块化设计:dify采用模块化的设计,每个模块都有清晰的功能和接口,可以根据需求选择性地使用。 3. 数据处理和特征工程:dify提供了丰富的数据处理和特征工程工具,包括数据清洗、特征选择、特征变换等功能,帮助开发者更好地准备数据。 4. 模型训练和评估:dify支持多种常见的机器学习算法,并提供了模型训练和评估的接口,方便开发者进行模型选择和性能评估。 5. 模型部署和服务化:dify支持将训练好的模型部署为API服务,方便其他应用程序进行调用和集成。 如果你想开发新模块,可以按照以下步骤进行: 1. 确定模块的功能和接口:明确你的模块要解决的问题,并设计好相应的功能和接口。 2. 实现模块代码:使用Python编写你的模块代码,可以借助dify提供的工具和接口来简化开发过程。 3. 测试和调试:对你的模块进行测试和调试,确保其功能正常并符合预期。 4. 文档编写:编写清晰的文档,介绍你的模块的功能、使用方法和示例代码等。 5. 提交和分享:将你的模块提交到dify的开源社区,与其他开发者分享你的成果。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

写代码的中青年

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值