AI 线稿上色,支持颜色提示与多角色参考

Cobra 开源 AI 上色模型:支持颜色提示与多角色参考

Cobra[1] 是一款专注于线稿上色的开源模型,其特色在于支持颜色提示(color hint)和多角色参考功能。

这里还有一个官方的在线演示[2],不过似乎已经坏了。

KeySync 开源高清嘴型同步方案

KeySync[3] 是一个开源的嘴型同步 AI 模型,能够生成高清的精准嘴型同步视频。

从官方演示视频来看,其唇形匹配效果不错,有需求的佬可以试用官方Demo[4]体验。

小米开源轻量级 MiMo-7B 模型系列

MiMo-7B[5] 是小米最新开源的小型系列模型,包含三个版本:基座模型、SFT 微调模型和 RL 强化学习模型。

官方号称在数学和代码推理任务上表现比肩 OpenAI o1-mini。

阿里巴巴达摩院 3DV-TON:视频虚拟试穿技术

阿里巴巴达摩院最新推出的 3DV-TON[6] 视频虚拟试穿模型,只需输入模特视频和服装照片,就能实现逼真的虚拟试穿效果。

该模型支持多种服装类型和复杂人体姿态,对服装褶皱、纹理等细节的还原度非常流畅。

目前只放出了演示,代码即将开源,关注我为你持续跟进。

DeepSeek 开源数学证明专家:Prover-V2 大模型

DeepSeek-Prover-V2 是 DeepSeek 节前发布的专为 Lean 4 形式化定理证明设计的开源大型语言模型。能够生成严谨、可验证的数学证明,适用于从高中到大学水平的数学问题。

目前代码和模型已经在 Hugging Face 上开源,感兴趣的佬可以去围观啦~

Claude 推出云端集成功能:一键调用 Zapier 等第三方服务

Claude 最新推出 Integrations 功能[7],可根据需求自动调用 Zapier、Asana、Linear 等第三方服务。目前该功能仅限 Max、企业版和 Team 会员使用。

此前 MCP 主要用于本地环境,这次推出的 Integrations 可以说是云端版的 MCP 了。

MidJourney 推出 Omni-Reference:参考生成

MidJourney 最新推出 Omni-Reference[8] 功能!

支持人物参考、物体参考、场景参考等多种参考模式,让 AI 生成更加精准。通过 --ow 0-1000 这个参数,你可以自由调整生成结果与参考素材的相似程度(数值越大相似度越高)。

具体完整日志和介绍可以看官方推文。

Suno v4.5 重磅升级:8 分钟长音乐生成

Suno[9] 正式发布 v4.5 版本更新,新版本支持更多音乐流派,有更好的情感语音合成,能够呈现更细腻的人声表现力。单次生成时长提升至 8 分钟。

完整更新日志可以查看官方推文哦~

Can You Run This LLM:大语言模型显存占用计算神器

「Can You Run This LLM」[10]是一个实用的 VRAM 计算工具,能测算不同大语言模型的显存占用情况。

不仅告诉你本地设备能否跑得动某个模型,还能模拟推理效果。

再也不用对着模型参数表瞎猜了,一键就知道你的显卡会不会爆显存。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值