🎥 阿里推出声画同步框架EMO
- 只需输入图片和音频即可生成会说话唱歌的视频。
- 多语言、对话、唱歌以及快速语速的适配。
- 为多语言、多样化场景下的角色表现提供新可能性。
🔗 https://top.aibase.com/tool/emo
👄Pika推出 Lip Sync【唇部同步】功能
- 只要提供语音或者文字。
- Lip Sync即可将生成视频中人物的嘴部动画和音频同步。
🔗 https://top.aibase.com/tool/pika
🔗 https://blink.csdn.net/details/1650931
🎥DomoAI发布fusion style功能
- 简单提示词改变视频风格,增加/替换视频中人物小物品或衣物。
- 视频中人物可替换成其他角色,如奥特曼,保持原动作姿态。
🔗 https://blink.csdn.net/details/1650932
📱MobiLlama:手机上运行的小型语言模型
- 基于LLaMA-7B设计,适用于边缘设备,如智能手机和平板。
- 体积小,资源需求低,但提供高精度语言理解和生成。
🔗 https://huggingface.co/MBZUAI
🔗 https://github.com/mbzuai-oryx/MobiLlama
🔗 https://blink.csdn.net/details/1650934
🔍 GitHub上线Copilot Enterprise通用版本
- 基于GPT-4的代码编写工具。
- 开发人员可通过文本提示获取、审核、扩展代码。
- 每月39美元,包含所有商业计划功能,支持大型团队。
🔗https://top.aibase.com/tool/github-copilot-enterprise
🎨 Playground 发布v2.5最新的文本到图像生成模型
- 高美感图像生成,提升视觉效果和美学质量。
- 改进多纵横比图像生成,灵活处理各种尺寸图像。
- 人物中心细节提升,采用新对齐策略减少视觉错误。
🔗 https://top.aibase.com/tool/playground-ai
🔗 https://huggingface.co/playgroundai/playground-v2.5-1024px-aesthetic
🔗 https://blink.csdn.net/details/1650930
📢谷歌豪掷 6000 万美元购买Reddit 数据,用来训练AI模型
- 谷歌将使用Reddit数据训练AI模型,加速AI发展步伐。
- Reddit作为资源丰富社交平台,为AI提供宝贵数据。
- Reddit联合创始人是第三大股东,引发讨论。