①🐭 Mickey-1928:专注米老鼠图像生成模型
•基于Stable-Diffusion-xl微调,生成1928年风格米老鼠图像。
•训练数据包括三部卡通的静止画面。
•模型下载:https://huggingface.co/Pclanglais/Mickey-1928
🔗 https://blink.csdn.net/details/1619243
②🎵 M2UGen:多模态音乐理解生成模型
- 理解音乐风格、乐器、情感,进行音乐问答。
- 根据文本、图像、视频生成音乐。
- 编辑音乐仅需文字描述。
- 该模型由腾讯与新加坡国立大学开发
🔗https://blink.csdn.net/details/1619226
③👀 VCoder:视觉编码器增强模型
- 增强LLM的视觉理解和分析能力。
- 处理分割图和深度图,改善对象感知。
- 在对象识别任务中表现优于GPT-4V。
- 项目链接:https://praeclarumjj3.github.io/vcoder/
- 代码库:https://github.com/SHI-Labs/VCoder
🔗 https://blink.csdn.net/details/1619224
④🗣️ DreamTalk:人物头像动画生成开源了
- 使人物照片头像根据音频说话或唱歌。
- 保持嘴型和表情一致。
- 代码库:https://github.com/ali-vilab/dreamtalk
🔗 https://blink.csdn.net/details/1619237
⑤💠 SVG-Loaders:纯SVG格式加载图标和动画
- 免费下载,适用于网页和应用。
- 高质量、多样设计,易于使用和自定义。
🔗https://blink.csdn.net/details/1619238