20240228 每日AI必读资讯_阿里emo github-CSDN博客

本文链接：https://blog.csdn.net/m0_46163918/article/details/136352696

近期，阿里、Pika和DomoAI等公司分别推出了创新技术，如声画同步框架EMO、唇部同步功能和视频风格转换工具。同时，GitHub的CopilotEnterprise和Playground的文本到图像模型升级也展示了AI在代码协作和艺术创作领域的突破。Google收购Reddit数据用于强化AI训练，推动行业发展。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

🎥 阿里推出声画同步框架EMO
- 只需输入图片和音频即可生成会说话唱歌的视频。
- 多语言、对话、唱歌以及快速语速的适配。
- 为多语言、多样化场景下的角色表现提供新可能性。
🔗 https://top.aibase.com/tool/emo

👄Pika推出 Lip Sync【唇部同步】功能
- 只要提供语音或者文字。
- Lip Sync即可将生成视频中人物的嘴部动画和音频同步。
🔗 https://top.aibase.com/tool/pika
🔗 https://blink.csdn.net/details/1650931

🎥DomoAI发布fusion style功能
- 简单提示词改变视频风格，增加/替换视频中人物小物品或衣物。
- 视频中人物可替换成其他角色，如奥特曼，保持原动作姿态。
🔗 https://blink.csdn.net/details/1650932

📱MobiLlama：手机上运行的小型语言模型
- 基于LLaMA-7B设计，适用于边缘设备，如智能手机和平板。
- 体积小，资源需求低，但提供高精度语言理解和生成。
🔗 https://huggingface.co/MBZUAI
🔗 https://github.com/mbzuai-oryx/MobiLlama
🔗 https://blink.csdn.net/details/1650934

🔍 GitHub上线Copilot Enterprise通用版本
- 基于GPT-4的代码编写工具。
- 开发人员可通过文本提示获取、审核、扩展代码。
- 每月39美元，包含所有商业计划功能，支持大型团队。
🔗https://top.aibase.com/tool/github-copilot-enterprise

🎨 Playground 发布v2.5最新的文本到图像生成模型
- 高美感图像生成，提升视觉效果和美学质量。
- 改进多纵横比图像生成，灵活处理各种尺寸图像。
- 人物中心细节提升，采用新对齐策略减少视觉错误。
🔗 https://top.aibase.com/tool/playground-ai
🔗 https://huggingface.co/playgroundai/playground-v2.5-1024px-aesthetic
🔗 https://blink.csdn.net/details/1650930