📝Glyph-ByT5:提高图像生成中文本渲染准确性的文本编码器:
- 文本渲染准确性提升至近90%。
- 能处理字母、词语至整段文字,智能排版和布局。
- 结合GPT-4和Glyph-SDXL模型自动化生成优化排版。
- 提供了项目地址和论文链接。
🔗项目地址:https://glyph-byt5.github.io
🔗论文:https://arxiv.org/abs/2403.09622
🎮Cartwheel:文本转3D动画工具:
- 输入文字提示即可生成适用于多种用途的3D动画角色。
- 支持指定动作,可以导出到任何3D程序中编辑。
- 处于早期阶段,但已生成许多酷炫动作,目前还在测试阶段,需排队。
🔗 Cartwheel
🎨Magnific AI的新功能 - 风格转换:
- 可以将任意照片转换成各种风格的图像,同时保持人物对象的一致性。
- 大BOSS的演示和教程,下周开放访问。
🍎 苹果大模型MM1入场:参数达到300亿 超半数作者是华人
- 苹果发布大型多模态基础模型MM1,拥有300亿参数,MoE架构,超半数作者是华人。
- MM1在多模态领域表现出竞争力,标志着苹果在该领域的重要进展。
- 该模型为未来苹果可能推出的产品奠定了技术基础,对GenAI领域发展具有重要意义。
🔗论文地址:https://arxiv.org/pdf/2403.09611.pdf
🤖全球最快AI芯片WSE-3发布 性能碾压H100!
- WSE-3采用4万亿晶体管5nm制程,拥有125FP16PetaFLOPS性能,比H100GPU强大。
- 单机可训练24万亿参数的模型,具备90万个AI核心和44GB片上SRAM存储。
- Cerebras的CS-3超算可训练比GPT-4和Gemini大十倍的下一代前沿大模型。