//社区生态//
-
文生音频初创公司ElevenLabs融资5亿。由前Google机器学习工程师Piotr Dabkowski和前Palantir策略分析师Staniszewski于2022年创立的ElevenLabs,专注文生音频AI赛道,完成B轮融资8000万美元,总估值超10亿美元,跻身独角兽行列。
//多模态大模型//
-
Meta开源音频生成新模型MAGNeT。Meta FAIR团队、Kyutai和希伯来大学推出了MAGNeT,通过单阶段、非自回归 transformer 生成音频,质量媲美SOTA自回归基线模型,同时速度提升7倍。
-
国防科大提出边缘检测扩散模型DiffusionEdge。国防科技大学提出了首个用于二维边缘检测任务的扩散概率模型方法DiffusionEdge,用更少的增强策略来预测清晰准确的边缘图。
//基础技术//
-
北大团队提出Aligner对齐新范式。借鉴残差学习和可扩展监督,北大团队提出替代RLHF的高效对齐范式Aligner,使用Seq2Seq模型学习答案对齐与未对齐之间的隐式残差,以优化对齐效果。