Overview 总览 摘要 1 引言 2 KOSMOS-2.5 2.1 模型结构 2.1 图像和文本表征 2.3 预训练数据 2.4 数据处理 2.5 过滤与质量控制 3 实验 3.1 评估 3.2 实现细节 3.3 结果 3.4 讨论 4 相关工作 4.1 多模态大语言模型