20240220 每日AI必读资讯

🚀 ElevenLabs宣布将上线AI音效功能:可给Sora生成的视频配音
- Sora生成的视频十分惊艳但缺少配音。
- ElevenLabs将推出AI音效功能,用户输入文字描述即可生成配音。
- 首批试用申请地址:
🔗 ElevenLabs Sound Effects Waitlist

图片

🌍Stability AI推出文生图模型Stable Cascade,仅限于非商用
- Stable Cascade基于Würstchen架构。
- 非商用许可证,仅限于非商业用途
- 压缩潜在空间,训练推理效率更高。
- 项目地址:https://top.aibase.com/tool/stable-cascade

图片

📈 图像分割模型Mask2Former:同时支持语义、实例和全景分割
- 优化后,在图像分割任务中取得卓越性能,包括多尺度高分辨率特征。
- 性能分析表明在多个任务上表现优越,但在资源受限设备上FPS可能受限。
- 架构包括特征提取网络、像素解码器和Transformer解码器,局部化注意力提升性能。

图片

🔍苹果推出AI动画设计工具Keyframer:可将静态图片转为动画
- 巨大潜力,但面临挑战。
- Keyframer结合自然语言提示和LLMs代码生成。
- 提供可能性,支持设计迭代,多用户群体参与动画创作。
- 论文地址:https://arxiv.org/pdf/2402.06071.pdf

图片

🌍Large World Model (LWM) 探索
- 介绍了百万Token的通用世界大模型,旨在理解长视频和超长文本。​
- LWM在100万个令牌的上下文中超越GPT-4V和Gemini Pro的检索精度。​
- 特色能力包括长视频理解、高精度事实检索和多格式内容生成。​
🔗 https://largeworldmodel.github.io​
🔗 https://github.com/LargeWorldModel/LWM​
🔗 https://blink.csdn.net/details/1646043

🎥马斯克揭示特斯拉视频生成技术
- 马斯克展示了特斯拉一年前掌握的生成真实世界视频技术。​
- 讨论了特斯拉和OpenAI在视频生成领域的努力及成果。​
- 特斯拉生成视频的独特之处在于其“动态生成世界”的能力。​

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值