Cosmos - 世界模型开发平台

在这里插入图片描述


一、关于 Cosmos

NVIDIA Cosmos是开发者第一的世界基础模型平台,旨在帮助物理AI开发者更好、更快地构建他们的物理AI系统。宇宙包含

  1. 预训练模型,可通过拥抱脸下的 NVIDIA开放模型许可证 获得,允许免费将模型用于商业用途
  2. 通过Apache 2许可证提供的 NVIDIA Nemo 框架 下的训练脚本,用于对各种下游物理AI应用程序的模型进行后期训练

该平台的详细信息在Cosmos论文中进行了描述。build.nvidia.com提供预览访问。


主要特点


模型家族

Model nameDescriptionTry it out
Cosmos-1.0-Diffusion-7B-Text2WorldText to visual world generationInference
Cosmos-1.0-Diffusion-14B-Text2WorldText to visual world generationInference
Cosmos-1.0-Diffusion-7B-Video2WorldVideo + Text based future visual world generationInference
Cosmos-1.0-Diffusion-14B-Video2WorldVideo + Text based future visual world generationInference
Cosmos-1.0-Autoregressive-4BFuture visual world generationInference
Cosmos-1.0-Autoregressive-12BFuture visual world generationInference
Cosmos-1.0-Autoregressive-5B-Video2WorldVideo + Text based future visual world generationInference
Cosmos-1.0-Autoregressive-13B-Video2WorldVideo + Text based future visual world generationInference
Cosmos-1.0-GuardrailGuardrail contains pre-Guard and post-Guard for safe useEmbedded in model inference scripts

二、使用示例

1、推理

遵循 Cosmos Installation Guide 设置docker。关于预训练模型的推理,请参考 Cosmos Diffusion Inference以及 Cosmos Autoregressive Inference.

下面的代码片段提供了推理用法的要点。

PROMPT="A sleek, humanoid robot stands in a vast warehouse filled with neatly stacked cardboard boxes on industrial shelves. \
The robot's metallic body gleams under the bright, even lighting, highlighting its futuristic design and intricate joints. \
A glowing blue light emanates from its chest, adding a touch of advanced technology. The background is dominated by rows of boxes, \
suggesting a highly organized storage system. The floor is lined with wooden pallets, enhancing the industrial setting. \
The camera remains static, capturing the robot's poised stance amidst the orderly environment, with a shallow depth of \
field that keeps the focus on the robot while subtly blurring the background for a cinematic effect."

# Example using 7B model
PYTHONPATH=$(pwd) python cosmos1/models/diffusion/inference/text2world.py \
    --checkpoint_dir checkpoints \
    --diffusion_transformer_dir Cosmos-1.0-Diffusion-7B-Text2World \
    --prompt "$PROMPT" \
    --offload_prompt_upsampler \
    --video_save_name Cosmos-1.0-Diffusion-7B-Text2World

text2world_example.mp4


Nvidia 还提供多GPU的推理支持扩散Text2World WFM模型通过NeMo框架。


2、后训练

NeMo框架为GPU加速后训练提供了扩散自回归模型的一般后训练,其他类型的后训练即将推出。


许可证和联系方式

本项目将下载并安装额外的第三方开源软件项目。在使用前查看这些开源项目的许可条款。

NVIDIA Cosmos源代码根据Apache 2许可证发布。

NVIDIA Cosmos 模型根据NVIDIA开放模型许可证发布。如需自定义许可证,请联系cosmos-license@nvidia.com


2025-01-29(三)

餐饮行业: 店外引流:在餐厅门口放置爆店码,顾客进店前碰一碰,就能了解今日特色菜品、优惠套餐等信息,吸引顾客进店消费。 店内互动:在餐桌等位置设置爆店码,顾客用餐过程中碰一碰,可参与抽奖活动、领取餐后优惠券,或跳转到电子菜单进行加菜,增加顾客的用餐乐趣和二次消费几率。 零售店铺: 服装门店:在橱窗展示新品时,贴上爆店码,顾客碰一碰可查看模特穿搭视频、获取商品详情和尺码信息,以及该商品的会员专属折扣。在试衣镜旁放置爆店码,顾客碰一碰能查看搭配建议、关注公众号或加入会员,提升引流转粉效率。 便利店:在收银台设置爆店码,顾客付款时碰一碰,可领取满减优惠券、了解会员积分规则,或获取当季新品推荐,促进顾客当场购买或成为会员,提升销售额和顾客忠诚度。 线下活动: 展会:在展会入口、展位等位置放置爆店码,参与者碰一碰就能快速获取展会详情、参展商名单、活动议程、展位地图等信息,方便活动的推广和组织,同时也能收集参与者的信息,为后续营销做准备。 促销活动:在商场中庭、店铺门口等举办促销活动时,使用爆店码。顾客碰一碰可了解活动规则、参与方式,还能直接领取电子优惠券或参与线上互动游戏,增加活动的参与度和传播度。 服务行业: 美业:在美甲美睫店的服务台、镜子旁等地方设置爆店码,顾客碰一碰可自动引导添加美业小助理微信,方便预约下次服务,也可获取美容护肤知识、会员专属优惠等信息。 健身行业:在健身房的前台、更衣室门口、器械旁放置爆店码。顾客碰一碰能了解课程安排、教练介绍,还可参与打卡活动,分享训练成果到社交平台,领取健身优惠券或小礼品,吸引更多潜在顾客。 旅游行业: 景区:在景区入口、景点打卡处等设置爆店码,游客碰一碰可获取景区地图、景点介绍、语音讲解,还能领取景区纪念品优惠券或参与线上互动活动,提升游客的旅游体验和景区的知名度。 酒店:在酒店大堂、客房门口、餐厅等位置放置爆店码。客人碰一碰可了解酒店
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

编程乐园

请我喝杯伯爵奶茶~!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值