![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
多模态
文章平均质量分 84
friedrichor
研一学生
研究方向:Large Multimodal Models, Multimodal Dialogue.
Github: https://github.com/friedrichor
知乎: https://www.zhihu.com/people/friedrichor
知乎持续更新,欢迎关注
展开
-
[ACL 2024 Main] StickerConv: 从零开始的多模态共情回复生成
ACL 2024 Main,基于 sticker 的多模态共情对话数据集、大模型和评价体系。原创 2024-05-23 16:10:15 · 1043 阅读 · 0 评论 -
推荐一个最近刚出的比较全面的多模态综述:Multimodal Deep Learning
多模态综述:Multimodal Deep Learning。对多模态、CV 和 NLP 领域中一些任务的 数据集、模型、评价指标等等 都做了较详细的介绍和总结。是个非常不错的综述,内容较全面且详细。原创 2023-01-14 10:00:00 · 5735 阅读 · 0 评论 -
使用预训练好的 DALLE 模型进行 Text-to-Image 生成图像
使用预训练好的 DALLE 模型进行 Text-to-Image 生成图像原创 2022-11-28 20:37:46 · 1360 阅读 · 2 评论 -
【论文&模型讲解】多模态对话 Multimodal Dialogue Response Generation
多模态对话论文 Multimodal Dialogue Response Generation,收录于 ACL 2022原创 2022-11-14 19:03:56 · 3400 阅读 · 6 评论 -
CCL2022自然语言处理国际前沿动态综述——开放域对话生成前沿综述
CCL2022自然语言处理国际前沿动态综述 之 开放域对话生成前沿综述,由哈尔滨工业大学计算学部、社会计算与信息检索研究中心的张伟男老师汇报。原创 2022-11-01 20:35:23 · 1882 阅读 · 4 评论 -
【论文&模型讲解】Two-Stream Convolutional Networks for Action Recognition in Videos
论文 Two-Stream Convolutional Networks for Action Recognition in Videos 讲解,收录于 2014 年的 NIPS (NeurIPS),是在视频领域中应用深度学习的开山之作。原创 2022-10-22 15:41:45 · 1416 阅读 · 0 评论 -
【论文&模型讲解】VideoBERT: A Joint Model for Video and Language Representation Learning
多模态论文 VideoBERT: A Joint Model for Video and Language Representation Learning 讲解原创 2022-10-17 20:05:45 · 2187 阅读 · 0 评论 -
【论文&模型讲解】CLIP(Learning Transferable Visual Models From Natural Language Supervision)
多模态模型 CLIP 讲解,对应论文 Learning Transferable Visual Models From Natural Language Supervision。CLIP 的方法很简单,但效果却意外的好。CLIP 的迁移能力是非常强的,预训练好的模型能够在任意一个视觉分类的数据集上取得不错的效果,而且最重要的是它是 zero-shot 的,即完全没有在这些数据集上做训练就能得到这么高的性能。原创 2022-10-12 09:00:00 · 18768 阅读 · 2 评论 -
【论文&模型讲解】ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision
ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision论文讲解原创 2022-10-05 18:01:42 · 3754 阅读 · 9 评论 -
开放型对话系统研究综述
对当前 对话系统 的发展进行总结 并 重点对开放型对话技术进行梳理。原创 2022-10-03 12:15:23 · 1190 阅读 · 0 评论 -
VL (Vision and Language) 任务简介及数据集
VL (Vision and Language) 任务简介及相关数据集原创 2022-10-01 16:08:44 · 852 阅读 · 0 评论 -
多模态论文汇总
随学习进度同步更新……原创 2022-09-19 20:07:22 · 903 阅读 · 0 评论 -
多模态 参考资料汇总
更新中……多模态学习资料原创 2022-08-03 03:00:24 · 251 阅读 · 0 评论