2024/01/04 每日AI必读资讯

程序员的店小二

已于 2024-01-04 17:02:24 修改

阅读量932

点赞数 22

文章标签：人工智能

于 2024-01-04 15:23:53 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46163918/article/details/135387531

版权

①🐭 Mickey-1928：专注米老鼠图像生成模型
•基于Stable-Diffusion-xl微调，生成1928年风格米老鼠图像。
•训练数据包括三部卡通的静止画面。
•模型下载：https://huggingface.co/Pclanglais/Mickey-1928
🔗 https://blink.csdn.net/details/1619243

②🎵 M2UGen：多模态音乐理解生成模型
- 理解音乐风格、乐器、情感，进行音乐问答。
- 根据文本、图像、视频生成音乐。
- 编辑音乐仅需文字描述。
- 该模型由腾讯与新加坡国立大学开发
🔗https://blink.csdn.net/details/1619226

③👀 VCoder：视觉编码器增强模型
- 增强LLM的视觉理解和分析能力。
- 处理分割图和深度图，改善对象感知。
- 在对象识别任务中表现优于GPT-4V。
- 项目链接：https://praeclarumjj3.github.io/vcoder/
- 代码库：https://github.com/SHI-Labs/VCoder
🔗 https://blink.csdn.net/details/1619224

④🗣️ DreamTalk：人物头像动画生成开源了
- 使人物照片头像根据音频说话或唱歌。
- 保持嘴型和表情一致。
- 代码库：https://github.com/ali-vilab/dreamtalk
🔗 https://blink.csdn.net/details/1619237

⑤💠 SVG-Loaders：纯SVG格式加载图标和动画
- 免费下载，适用于网页和应用。
- 高质量、多样设计，易于使用和自定义。
🔗https://blink.csdn.net/details/1619238

程序员的店小二

关注

22
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
2024/01/04 每日AI必读资讯

•模型下载：https://huggingface.co/Pclanglais/Mickey-1928。- 项目链接：https://praeclarumjj3.github.io/vcoder/。- 代码库：https://github.com/ali-vilab/dreamtalk。•基于Stable-Diffusion-xl微调，生成1928年风格米老鼠图像。- 代码库：https://github.com/SHI-Labs/VCoder。- 该模型由腾讯与新加坡国立大学开发。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。