山东大学软件学院项目实训-创新实训-时空漫游（二）

晚风.623

已于 2024-05-29 20:52:38 修改

阅读量1.3k

点赞数 42

文章标签：人工智能

于 2024-04-24 13:23:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_62815101/article/details/138156340

版权

ModelScope 魔搭社区部署模型

1. 用户如何在魔搭社区一键部署模型？

魔搭开源社区的模型库中有很多热门开源模型支持一键部署，支持用户在模型库列表页面选择支持快速部署的模型，然后点击进入模型详情页，其中模型详情页的右上角包含有部署按钮，可以进行快速部署。

模型列表页：过滤支持模型部署的模型列表

模型详情页：右上快速部署，这里以chatglm3-6b为例，该模型支持快速部署和训练服务。

另外，也可以切换至首页，通过左侧【模型服务】进入模型部署服务页面。

在新建快速部署后，用户可以针对模型部署信息进行配置，包括必要的部署模型版本、部署地域、部署卡型、部署显存等。

当用户点击确认快速配置无误后，通过点击【一键部署】按钮，从而进入部署过程；整个过程一般持续1-5分钟，当部署完成后，可以看到服务状态切换为【部署成功】。

2. 用户在魔搭一键部署模型到阿里云函数计算FC后，实际在FC部署了什么？

当用户将魔搭开源模型一键部署（SwingDeploy）到阿里云函数计算FC后，实际上是在阿里云函数计算FC平台创建了对应的服务与函数。函数计算平台在收到该函数的推理请求调用后，会根据服务和函数的配置来创建对应的CPU/GPU容器实例。函数实例处理完请求后，再由平台将响应返回给用户。对应的CPU/GPU容器实例空闲一段时间没有处理调用请求后，函数计算平台会将其释放。所以默认情况下，空闲未使用的服务/函数没有资源消耗，函数计算仅对请求处理部分计费。使用魔搭的“模型服务”SwingDeploy一键部署模型到函数计算后，可以在部署列表中看到“服务名称”，使用服务名称可以到函数计算控制台相应地域的服务列表找到部署好的服务和函数。

3. 用户如何调用部署在FC的模型？

在已部署的模型处点击详情后，用户可以通过魔搭平台提供的示例代码调用已部署好的模型。

4. 部署在FC的模型首次调用耗时长，后续调用耗时短。

函数如果长时间空闲（没有推理调用发生），FC平台会通过回收函数容器实例来释放资源。函数计算平台在收到一个调用请求后，会判断当前是否有空闲的函数容器实例可供使用，如果没有，则需要新创建一个函数容器实例来服务该请求，这个过程称之为冷启动。

如果函数应用本身初始化时间耗时较长（比如应用三方依赖加载、大模型初始化），那么该函数容器实例上发生的初次推理请求的端到端时延也会增加，例如，初始化较大的模型文件（ChatGLM-6B模型文件15GB、QWen Chat 14GB）。为了应对LLM大模型场景，函数容器实例按照弹性规则，可以分为按量和预留两种模式。

在FC控制台中，可以在函数详情的“弹性管理”选项卡配置弹性规则；弹性管理的详细配置方法详见文档。

例如：可以通过如下操作指导，预留指定数量的GPU实例（测试目的：一般建议预留1个GPU实例）。

切换至函数的弹性管理Tab页

设置函数的LATEST版本，至少预留1个GPU实例

查看当前预留实例数量，是否满足目标预留实例数量。（上图表明完成指定数量的GPU实例预留）

当预留实例就绪后，推理请求调用会被优先分配至该预留实例上执行，从而规避按量场景下的冷启动。

用户可以通过请求级别的日志观测，来查看请求是由按量实例服务、还是预留实例服务。

截屏2023-08-15 下午5.30.56.png

通过删除弹性规则，可以删除对应预留实例。

注意：预留实例的生命周期，完全由用户全权负责。

关注

42
点赞
踩
34

收藏

觉得还不错? 一键收藏
0
评论
山东大学软件学院项目实训-创新实训-时空漫游（二）

魔搭开源社区的模型库中有很多热门开源模型支持一键部署，支持用户在模型库列表页面选择支持快速部署的模型，然后点击进入模型详情页，其中模型详情页的右上角包含有部署按钮，可以进行快速部署。另外，也可以切换至首页，通过左侧【模型服务】进入模型部署服务页面。在新建快速部署后，用户可以针对模型部署信息进行配置，包括必要的部署模型版本、部署地域、部署卡型、部署显存等。当用户点击确认快速配置无误后，通过点击【一键部署】按钮，从而进入部署过程；整个过程一般持续1-5分钟，当部署完成后，可以看到服务状态切换为【部署成功】
复制链接

扫一扫

晚风.623 CSDN认证博客专家 CSDN认证企业博客

码龄3年

7: 原创

134万+: 周排名

9万+: 总排名

5496: 访问

: 等级

232: 积分

89: 粉丝

150: 获赞

12: 评论

122: 收藏

私信

关注

热门文章

最新评论

山东大学软件学院项目实训-创新实训-时空漫游（六）
是Yu欸: 博主用心很有耐心，更有对知识的热忱和热爱，写了这么实用有效的分享。
山东大学软件学院项目实训-创新实训-时空漫游（四）
是Yu欸: 这是一篇高质量的好文，深度理解和清晰的表达方式使复杂的技术概念变得容易理解，值得收藏点赞。
数字图像处理实验
2301_80838793: 满满的干货啊
数字图像处理实验
rycjh: 很厉害👍
数字图像处理实验
CSDN-Ada助手: 恭喜您开始写博客！标题"数字图像处理实验"让我感到兴奋，我期待着能读到您对这个领域的深入研究和实践经验。在下一篇博客中，或许您可以分享一些常见的数字图像处理技术，以及它们在实验中的应用案例。希望您能保持谦虚的态度，继续努力，我相信您的博客会给读者带来更多的启发和知识分享。推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。