华为云Flexus+DeepSeek征文｜Flexus云服务器从零到畅玩大模型的极致输出

雾非雾の迷惘

已于 2025-05-22 12:06:44 修改

阅读量1k

点赞数 59

文章标签：华为云经验分享服务器

于 2025-05-22 11:34:08 首次发布

本文链接：https://blog.csdn.net/Dovis5884/article/details/148135650

版权

#新星杯·14天创作挑战营·第11期#

前引：随着人工智能技术的快速发展，大语言模型(LLM)已成为当今科技领域的焦点。作为开发者，我们有幸站在这一技术革命的前沿，有机会亲身体验并参与到这场智能变革中。近期，我有幸参与了华为云推出的MaaS(Model-as-a-Service)平台，试用了其DeepSeek大模型推理服务，并基于华为云Flexus云服务部署了Dify一键解决方案。这个过程不仅让我领略到了前沿AI技术的魅力，也让我对如何将大模型应用于实际业务场景有了更深刻的理解！

本文目的：我将分享我的体验与探索：从初次接触DeepSeek模型的激动，到利用华为云强大基础设施快速部署Dify平台的成就感，再到构建AI Agent过程中的思考与收获。希望通过我的亲身体验，能够为同样对大模型技术感兴趣的开发者们提供一些有价值的参考和启发~正文开始

一、启用DeepSeek-R1/V3商用版本

华为云Dify-LLM介绍

Dify-LLM是一款开源的大语言模型（LLM）应用开发平台，支持从Agent构建、AI工作流编排到RAG检索、模型管理等全链路能力，可快速搭建生产级生成式AI应用。其核心优势在于低代码交互界面和模块化设计，开发者无需从零开始开发，即可通过可视化工具实现AI应用的原型设计与迭代。基于华为云Flexus云服务器部署Dify-LLM，开发者可私有化搭建平台，既能保障数据安全，又能通过弹性资源实现灵活扩展。该方案尤其适合企业级智能客服、知识库问答、自动化流程等场景！下面跟着小编来实时感受吧！

Dify-LLM核心优势

（1）极致性能优化

支持GPU/FPGA硬件加速，自动调整计算资源负载，算力效率提升40%以上

采用自研RDMA网络技术，跨AZ（可用区）数据传输延迟低于10ms，满足高并发推理需求

（2）极致部署体验

通过预置模板（如Dify单机版/高可用版），用户仅需配置密码和基础参数，10分钟内即可完成全流程部署，无需手动安装依赖或调试环境，提供资源栈管理界面，支持实时监控CPU/内存利用率、自动回滚异常配置，运维复杂度降低70%，画面简洁同时不失技术感！

（3）企业级安全防护

全链路支持TLS 1.3加密，结合华为云KMS密钥管理服务，实现模型参数与用户数据的端到端保护

（4）成本控制

支持按小时计费模式，单机部署全程不到6元即可酣畅淋漓的体验，空闲时段可释放资源避免浪费

准备工作

一、启用DeepSeek-R1/V3商用版本

（1）首先我们需要注册华为账号、之后进行认证，才可以之后进行云服务

（2）选择下面的“控制台”

（3）选择“在线推理”

（4）选择“商用服务”“开通服务”

注：本次部署体验使用旁边的免费版本也是可以的

（5）商用版需要注意收费的标准

二、打开计费预警提示

在部署成功之后是会收费的，为了部署失败，尽量在单机部署前充值大概10元，完全够用！

为了避免在使用时因为操作问题，导致过多的扣费，可在“费用”处设置费用管理预警

三、权限许可

可以在MoodelArts Studio控制台授权一下，避免以后搭建失败

Dify-LLM云服务单机部署

（1）点击单机部署

（2）可以使用默认模板，点击下一步

（3）自己设置密码、选择版本，“资源加密”根据自身需求，可以打开可不打开

（4）打卡回滚设置，可以在出错时回到上一步，提高操作率，删除保护自身需求

（5）确认配置，没有问题之后点击创建执行计划

（6）点击确定

（7）点击部署

（8）大概10分钟后，部署显示完成

完成以上部署之后，我们就可以开始搭建AI模型了！

实战搭建AI Agent

（1）Dify-LLM云服务单机部署成功之后点击输出，获取网址，浏览器打开

（2）自己设置账号密码

（3）再次输入账号邮箱、密码

（4）右上角点击设置

（5）找到供应模型，然后点击OPen AI这个模型，点击安装

（6）下面我们分别获取API地址和秘钥、名称

去MoodelArts Studio控制台，点击在线推理

分别复制上面的地址、名称，粘贴在上面的配置表里面

在返回控制台，点击API管理，创建API

自己设置一个昵称，然后保存，复制生成的秘钥到刚才的配置表

（7）配置表设置完名称、地址、秘钥之后，点击保存就可以看到下面这样添加成功了

（8）返回主页，点击创建空白应用

（9）选择Agent，设置昵称，创建

（10）点击生成，用来配置Agent类型

（11）设置Agent类型，点击生成，然后应用

（12）如果不想变量太多嫌麻烦，可以点击这里，取消“必填”选项，保存即可

（13）没问题之后，可以预览效果，然后发布，更新配置，运行，就搭建完毕可以使用了

实战搭建聊天助手

（1）Dify-LLM云服务器单机部署成功之后点击输出，获取网址，浏览器打开

（2）自己设置账号密码

（3）再次输入账号邮箱、密码

（4）右上角点击设置

（5）找到供应模型，然后点击OPen AI这个模型，点击安装

（6）下面我们分别获取API地址和秘钥、名称

去MoodelArts Studio控制台，点击在线推理

分别复制上面的地址、名称，粘贴在上面的配置表里面

在返回控制台，点击API管理，创建API

自己设置一个昵称，然后保存，复制生成的秘钥到刚才的配置表

（7）配置表设置完名称、地址、秘钥之后，点击保存就可以看到下面这样添加成功了

（8）返回主页，点击创建空白应用

（9）选择聊天助手，设置昵称，选择保存

（10）点击生成，选择类型

（11）自己设置提示词类型，然后生成，应用

（12）如果不想太多的变量，点击这里

（13）关闭“必填”，保存就可以了

（14）随后就可以预览效果了，没问题之后，点击更新，运行即可正常使用

如何删除资源停止计费

（1）在搜索栏搜索“资源编排”打开

（2）点击资源栈，在这里面可以看到已经部署成功的资源

（3）如果要删除，点击“删除”即可，这样才会停止计费

测评体验

性能对比

华为云Flexus与Dify的结合，为AI开发者提供了开箱即用的解决方案。其核心价值对比如下：

指标参数   华为云Flexus   传统云服务器（如AWS EC2）   本地物理服务器
部署耗时   8-10分钟   30分钟-2小时   数小时至数天
模型推理延迟   平均响应<2秒   3-5秒   5-8秒
横向扩展能力   5分钟内扩容至8节点   需手动配置负载均衡   需采购新硬件
月均成本   197元（单机版）   350-500元（同配置）   固定投入超万元