前言
本文主要介绍如何使用华为云 Model Arts Studio 大模型开发平台 商用服务的开通与使用,分享个人使用经验以及感受
注:避免测试过程中出现部署失败等问题,需确保华为云账号余额大于10元,充值地址:点击此处充值
Model Arts Studio 大模型开发平台 地址:https://www.huaweicloud.com/product/modelarts/studio.html
什么是华为云 ModelArts Studio
概述
华为云 ModelArts Studio 是由华为云推出的 大模型AI开发与部署平台,平台集成了模型开发、模型应用等全流程能力,支持大模型高效开发部署落地。 同时预制了 主流模型 (如DeepSeek-V3/R1 大模型)与部署工具, 旨在帮助企业快速落地 AI 应用,降低 AI 开发和部署的门槛。 支持按需付费,即token模式。 用多少付多少,大幅减少部署AI应用的成本,高效完成AI转型。
官网地址:ModelArts Studio_MaaS_大模型即服务_华为云
产品优势
- 开箱即用:集成业界主流开源大模型,如 Llama、Baichuan、Yi、Qwen 等,用户无需自建平台,可直接基于 ModelArts Studio 对预置大模型进行二次开发。
- 成本效益:资源可分钟级获得,按需收费,按需扩缩容,有效避免资源闲置与浪费,同时支持故障快速恢复和断点续训,进一步降低成本。
- 高性能:基于昇腾 AI 云服务进行全面适配和优化,显著提升模型的训练和推理性能,基于昇腾算子、显存优化等技术,让大模型训练与推理性能大幅提升,并围绕大模型性能与精度评价体系构建标准化自动流水线。
- 零代码开发:提供一键式训练、自动超参调优等能力,支持零代码、免配置、免调优的模型开发,显著缩短开发周期,降低开发难度,让没有深厚技术背景的人员也能进行模型开发。
- 全生命周期管理:提供模型调优、压缩、部署、评测等全栈工具,覆盖大模型全生命周期,支持用户即开即用,低门槛使用各类大模型,助力企业高效管理模型的整个生命周期。
- 高可用性:多数据中心部署确保数据与任务备份,即使遭遇故障也能无缝切换至备用系统,保障业务的连续性和稳定性。
- 一站式应用能力集成:LangChain、九问、RAG、Agent、Guard 等组件化集成,可快速构建一站式应用;并且 MaaS 提供的模型服务与各 AI 应用层构建工具之间相互连通,通过灵活的组合方案,帮助客户快速解决模型落地应用时所面临的业务及技术挑战。
产品架构
ModelArts Studio 开通 基于 DeepSeekV3/R1 商用服务流程
注册华为云
点击右上角注册按钮,进入注册页面
进入注册页面后,填写具体的信息,注册账号
注册完成后,点击此处 去登录华为云账号 (使用云服务前需进行实名认证)
进入ModelArts Studio 大模型平台
点击此处 跳转 至ModelArts Studio 大模型平台
点击按钮 进入ModelArts Studio控制台
根据提示勾选并同意协议
首次登录需要进行大模型授权,点击此处去完成授权
勾选并同意协议 点击创建
配置授权
进行权限更新
更新成功
开通DeepSeekV3/R1商业服务
授权完成后,点击左侧导航栏,打开在线推理页面,可以看到有两种商业模式选择,根据自身需求,选择开通服务即可
服务采用Token计费,输入和输出的价格,具体的费用请参考 调用统计。
- DeepSeek - V3 - 32K:是通用型模型,像 “文科生” 或 “万能助手”,擅长自然语言处理任务,如文本生成、多语言翻译、智能客服等。在内容创作、多语言处理方面表现出色,也适用于需要处理文本、图像、音频等多模态信息的场景,如短视频内容审核。
- DeepSeek R1 - 32K:是逻辑推理专家,如同 “理科生” 或 “专业顾问”,专为数学证明、代码生成、金融分析、医疗诊断辅助等复杂逻辑推理任务优化,在解决数学难题、编程任务、复杂决策等场景中表现卓越。
打开控制台,进入模型推理-在线推理模块
选择商用服务,开通DeepSeek-V3/R1大模型的商用服务(注意需要确保账号内余额大于10元)
模型按需付费,超便宜,超划算。
点击商业服务,以DeepSeek V3-32K为例 进行体验,点击开通服务 两者服务开通流程一致
勾选并同意协议,点击开通
绿色即为开通成功
使用DeepSeekV3 32K 商用服务
点击操作栏中的在线体验按钮,进行体验
可以看到已经进入体验画面
在文本对话上面,单击参数设置,拖动或直接输入值可以配置推理参数,单击即可恢复默认。
温度/Temperature | 核采样/top_p | top_k |
该参数用于控制生成文本的随机性或创造性,数值越高,生成内容更具备多样性和创新性,但也更有可能包含错误或不连贯的内容。 | 调整输出文本的多样性,数值越大,生成文本的多样性就越高。 | 通常是指在模型的输出中选择概率最高的前K个结果 |
在对话框输入内容,查看返回结果,体验对话问答
在最后可以看到输入与输出的token
结语
使用华为云开通ModelArts Studio 大模型 时 是非常流畅,清晰,简单的。
三步即可实现大模型的部署。 使用过程中,DeepSeek V3 相应的结果非常准确,回答问题很流畅。 相比之下 DeepSeek R1 更是有了深度思考等特性,在商用服务选择上,两者各有各的好处,大家可以根据自己的使用场景来进行选择开通商用服务。