自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_50363058的博客

小钦钦qpr CSDN认证博客专家 CSDN认证企业博客

码龄4年

2: 原创

93万+: 周排名

19万+: 总排名

2313: 访问

: 等级

58: 积分

40: 粉丝

37: 获赞

1: 评论

46: 收藏

私信

关注

热门文章

分类专栏

多模态CoT 1篇

最新评论

Multimodal Chain-of-Thought Reasonging in Language Models的阅读笔记
CSDN-Ada助手: 恭喜您开始了博客创作，标题“Multimodal Chain-of-Thought Reasoning in Language Models”的主题十分有趣。建议在阅读笔记的基础上，可以进一步探讨不同模态之间的关联性，或者探讨语言模型在实际应用中的挑战与发展方向。期待看到您更多的精彩文章，加油！祝您创作顺利！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

多模态CoT

关注

文章平均质量分 94

关注数：文章数：1 文章阅读量：1158 文章收藏量：21

作者: 小钦钦qpr

这个作者很懒，什么都没留下…

展开

Multimodal Chain-of-Thought Reasonging in Language Models的阅读笔记

大语言模型利用思维链提示生成中间推理链作为推断答案的基本原理，在复杂推理方面表现出令人印象深刻的性能。现有研究主要集中在语言形态上，文中提出了多模态coT，将语言和图像模态分为两个阶段的框架，分离理由生成和答案推理。通过这种方式，答案推理可以利用多模态信息生成更好的理由。Mulitimodal-CoT，在十亿个参数下的性能比LLM（chat-3.5）高出16个百分点，甚至超过了ScienceQA基准的人类性能。

原创 2024-03-16 16:52:14 · 1158 阅读 · 1 评论