研究
-
链接描述DGMamba:通过广义状态空间模型进行域泛化。 DGMamba 是一个新框架,利用新颖的状态空间模型 Mamba 来解决域泛化问题。
-
操纵大型语言模型以提高产品可见性。可以通过在产品描述中添加策略文本序列来操纵搜索引擎的广泛语言模型,以推广特定产品。
-
MindBridge:跨学科大脑解码框架。 MindBridge 是一个单一模型,可以解释多个受试者的大脑活动。
-
驯服文本到 360° 全景图像生成的稳定扩散。在文字提示的帮助下,该项目展示了 PanFusion,一种创建 360 度全景图像的双分支扩散模型。为了最大限度地减少视觉失真,该技术将稳定扩散方法与定制的全景分支相结合,并通过特殊的交叉注意机制进一步改进。
-
语言模型的物理学。缩放定律描述了语言模型的大小与其能力之间的关系。与之前通过损失或基准评估模型能力的研究不同,我们估计模型存储的知识位数。
-
NLP与其他领域的影响。尝试衡量 NLP 对超过 23 个不同研究领域的影响程度; NLP的跨领域参与度从1980年的0.58下降到2022年的0.31;研究还