前言:
随着人工智能的火速发展,AI相关的技术越来越成熟,智能体(AI Agents)正逐渐成为人与大模型(如大语言模型)交互的主要方式。智能体是能够执行任务、解决问题并提供服务的 AI 系统,它们通过模拟人类的行为和决策过程,使得与大模型的交互更加自然、高效和个性化。
一个基于大模型的AI Agent系统可以拆分 LLM(大模型)、记忆(Memory)、任务规划(Planning)以及工具使用(Tool) 的集合。在LLM为基础的AI Agent系统中,大模型为AI Agent系统的大脑负责计算,并需要其他组件进行辅助。
今天给大家来介绍一款 - 华为云Flexus与开源项目DeepSeek的深度融合产品,为AI Agent的搭建提供了强大的底层能力。而Dify平台作为一站式的大模型应用开发工具,也让智能体的构建更加轻量与灵活。
一、什么是华为云推出的Dify-LLM应用开发平台:
随着生成式AI技术的快速发展,怎么样快速构建和部署大模型应用成为各行各业关注的焦点。最近,由华为云推出的Dify-LLM应用开发平台,结合Flexus X实例的卓越性能,为用户提供了一站式生成式AI的解决方案。
-
①. 该解决方案可以在华为云上快速部署单机版、高可用版Dify LLM应用开发平台,同时支持将在Dify应用开发平台创建的的文档知识库挂载华为云对象存储服务 OBS桶。
-
②. Dify是一款开源的大语言模型(LLM)应用开发平台。它融合了后端即服务(Backend as Service)和LLMOps的理念,使开发者可以快速搭建生产级的生成式AI应用。
-
③. Flexus X实例是华为云基于擎天架构、瑶光云脑、盘古大模型等核心技术打造的全新云服务器产品。
本文将从单机部署搭建到AI Agent开发,从0到1来实现华为云Dify平台的部署与开发流程,并重点展示Flexus X实例在算力、成本、可靠性等方面的核心优势。
二、华为云Dify-LLM应用开发平台实战:
首先需要进行华为云的实名认证,并且需要先保证充值10元左右,因为在实验的过程中需要开通DeepSeek商用大模型,是需要收费的,一般在5-10元左右,这里建议给个优惠券更好。
2.1 华为云账号注册与实名认证:
可以打开以下链接先进行华为云账户的注册与实名认证,人个中心,注册推荐使用手机号就可以,密码一定要记住,否则找回时比较流程繁琐。
这里推荐使用“人个认证”,可以选“身份证”进行实名认证,也比较简单,完成注册华为云账号并完成实名认证。接下来就是要确保账户余额充足(建议不低于10元)。千万要先进行充值,否则在部署时,会出现失败的情况。
充值也是比较简单一点,华为云的收银台也是提供了多种充值的渠道,我这里使用的是支付宝充值。
2.2 开通模型服务:
若需接入DeepSeek等商用大模型,需在 华为云ModelArts Studio控制台开通在线推理服务(支持免费体验或商用按需计费)。
选择"模型推理 -> 在线推理",开通DeepSeek-V3-32K大模型的商用服务(未使用服务时不会产生费用),开通以后可以进行“在线体验”一下。
2.3 在ModelArts Studio(MaaS)预置服务中开通商用服务的作用:
MaaS预置服务的商用服务为企业用户提供高性能、高可用的推理API服务,支持按Token用量计费的模式。该服务适用于需要商用级稳定性、更高调用频次和专业支持的场景:
- ①. 企业智能客服:企业希望利用推理API优化客服系统,实现智能问答、意图识别,提升客服效率与客户满意度。
- ②. 内容创作辅助:媒体、广告公司借助推理API进行文案创作、创意生成,提高内容产出的效率与质量。
- ③. 智能数据分析:金融、电商企业通过推理API对海量数据深度分析,挖掘数据价值,辅助决策制定。
三、单机部署Dify-LLM平台:
解决方案帮助快速部署单机版、高可用版Dify LLM应用开发平台,同时支持将在Dify应用开发平台创建的的文档知识库挂载华为云对象存储服务 OBS桶。
可以直接访问快速搭建Dify-LLM应用开发平台-华为云,在“方案架构”里面选择“一键部署(社区单机部署)”。
这里可以看到有一个“预估成本”,单机:2~5元( 按需计费:Flexus云服务器X实例0.95元/小时,弹性公网IP EIP 0.80元/GB,体验本方案预计成本不超过5元)。
第一步是“选择模板”:
这里默认会内置一个模板“已有模板”,同时,也会提供一个模板的URL,也是一个默认提供好的json文件:
可以看到这里会规定一些相关的配置参数:
- ①. 实例规格:弹性云服务器 ECS规格请参考部署指南配置,默认:x1.8u.16g(8核16G内存)。
- ②. 云服务器系统盘:云服务器系统盘大小,磁盘类型默认为高IO,单位:GB,取值范围为40-1,024,不支持缩盘,默认:100。
- ③. 网络配置:弹性公网带宽大小,该模板计费方式为按流量计费,单位:Mbit/s,取值范围:1-300Mbit/s,默认:300。
第二步是“参数配置”:
上面是名称与描述相关的参数,资源栈名称不能重名,最好自定义一下,不过,建议这里搞一个ajax自动校验的功能,看看是否重名了,这样交互的体验更好一点。
下面可以看到有一些参数的设置,是不是跟上面那个json的配置文件很像呢?不过,我这里也是在测试阶段,就用默认的参数即可,先体验一把再说,如果有特殊要求,可以进行修改,比如访问的人多,可以合理调整一下带宽。
开启加密,因为初次开启加密功能会自动为创建“aos/default”默认密钥,可以授权资源编排服务创建并使用密钥。
第三步“资源栈设置”:
“IAM权限委托”可明确定义RF服务在资源栈上可执行的所有操作(如创建、更新、删除资源栈等),如果委托权限不足,有可能导致后续部署、生成执行计划等操作失败。
这里有一个IAM权限委托的选择:
- ①. 如果是测试用户,可以不进行创建。
- ②. 如果是公司的账号,只有一个的话,建议创建,可以更精细化控制权限。
另外,建议勾选“回滚设置”,开启回滚表示操作失败时,会自动回滚至系统所保存的上一个成功的资源状态,但是在创建后可在资源栈详情页面修改。
“删除保护”可以防止资源栈被意外删除,创建后可在资源栈详情页面修改。
第四步“配置确认”:
资源编排服务使用免费,但资源栈内包含的资源可能需要付费,可通过创建执行计划后获取预估费用。
这个页面是对前面三个步骤填写的内容做一个确认操作的页面,就是密码这个是打*号了,无法去确认,可以优化一下,再一次输入确认密码的话,这样更安全。
这里可以直接点“直接部署资源栈”,也可以点击“创建执行计划”(推荐),这样就可以看到比较详细的部署流程,万一有错误,可以及时的发现与调整。
等到“事件”中出现“Apply required resource success”,表示该解决方案资源已发放完成。
确认参数后启动部署创建资源栈,约10分钟完成云服务器、安全组等资源部署,通过输出链接访问Dify Web界面。
四、总结:
随着人工智能技术的飞速发展,AI智能体(AI Agent)凭借其自主感知、决策和执行能力,正成为人机交互的核心载体,这类智能实体通过模拟人类行为模式,显著提升了大模型交互的自然性与效率,构建AI智能体系统需四大核心组件支撑:
- ①. 大语言模型(LLM):作为系统“大脑”,承担核心计算与推理任务
- ②. 记忆模块:实现经验存储与上下文关联
- ③. 任务规划:自主拆解目标并生成执行路径
- ④. 工具调用:整合外部资源完成任务执行
华为云推出的Dify-LLM应用开发平台,深度融合Flexus X实例的擎天架构与盘古大模型能力,为开发者提供了一站式智能体构建解决方案。该平台支持:
- ①. 快速部署:10分钟完成单机/高可用架构搭建,弹性云服务器成本低至0.95元/小时
- ②. 生态集成:无缝对接DeepSeek商用大模型及华为云OBS对象存储
- ③. 企业级支持:通过ModelArts Studio提供高可靠推理API服务,满足智能客服、内容创作等场景需求
通过实操验证,开发者仅需完成实名认证、模型服务开通、资源栈配置三步,即可在华为云上高效部署智能体应用开发环境。Flexus X实例在算力性能与成本控制上的突破,为AI智能体从实验室走向产业化提供了坚实基础。