论文阅读笔记_me_yundou的博客-CSDN博客

论文阅读笔记

关注

文章平均质量分 94

关注数：文章数：21 文章阅读量：66414 文章收藏量：501

作者: me_yundou

哈喽哈

展开

【论文阅读】Tabular Insights, Visual Impacts: Transferring Expertise from Tables to Images - 表格，图像分类，跨模态迁移

论文阅读，经验分享。ICML 2014 spotlight 论文：Tabular Insights, Visual Impacts: Transferring Expertise from Tables to Images。关于表格数据，图像分类，多模态学习，跨模态迁移等。本博客系博主根据个人理解所写，非逐字逐句翻译，预知详情，请参阅论文原文。如有理解不当的地方，欢迎大家一起讨论。

原创 2024-07-29 17:17:27 · 752 阅读 · 0 评论
【论文阅读】NIPS 2023 Connecting Multi-modal Contrastive Representations 多模态表征，跨模态对比学习表征，图像，文本，音频，3D

【论文阅读】NIPS 2023 Connecting Multi-modal Contrastive Representations 多模态表征，跨模态对比学习表征，图像，文本，音频，3D

原创 2023-11-06 22:30:29 · 1147 阅读 · 1 评论
【论文阅读】Multi-Modal Sarcasm Detection via Cross-Modal Graph Convolutional Network 嘲讽检测，多模态，跨模态，图神经网络

ACL 2022 论文阅读：Multi-Modal Sarcasm Detection via Cross-Modal Graph Convolutional Network 嘲讽检测，多模态，跨模态，图神经网络。本博客系博主根据个人理解所写，非逐字逐句翻译，预知详情，请参阅论文原文。

原创 2023-02-20 20:16:57 · 3224 阅读 · 0 评论
【论文阅读】跨域推荐系统相关论文学习

一些跨域推荐系统相关论文学习的总结和部分心得体会，本博客系博主根据个人理解所写，非逐字逐句翻译，预知详情，请参阅论文原文。

原创 2022-12-01 09:53:24 · 686 阅读 · 0 评论
【论文阅读】Emphasizing Complementary Samples for Non-literal Cross-modal Retrieval 图文检索多模态

CVPR 2022 workshop论文阅读，标题：Emphasizing Complementary Samples for Non-literal Cross-modal Retrieval。本博客系博主根据个人理解所写，非逐字逐句翻译，预知详情，请参阅论文原文。

原创 2022-11-30 16:55:24 · 375 阅读 · 0 评论
【论文阅读】Polysemous Visual-Semantic Embedding for Cross-Modal Retrieval 多义性视觉-语义编码跨模态检索视频图像文本

论文阅读，CVPR 2019 论文：Polysemous Visual-Semantic Embedding for Cross-Modal Retrieval，本博客系博主根据个人理解所写，非逐字逐句翻译，预知详情，请参阅论文原文。

原创 2022-11-22 11:23:19 · 665 阅读 · 0 评论
【论文阅读】Embracing Domain Differences in Fake News: Cross-domain Fake News Detection using 多模态数据

AAAI 2021 论文阅读，论文标题：Embracing Domain Differences in Fake News: Cross-domain Fake News Detection using Multimodal Data。本博客系博主根据个人理解所写，非逐字逐句翻译，预知详情，请参阅论文原文。

原创 2022-11-09 11:50:04 · 943 阅读 · 4 评论
【论文阅读】Anti-Forgery: Towards a Stealthy and Robust DeepFake Disruption Attack viaAdversarial Percept

IJCAI 2022论文阅读，论文标题Anti-Forgery: Towards a Stealthy and Robust DeepFake Disruption Attack viaAdversarial Percept。本博客系博主根据个人理解所写，非逐字逐句翻译，预知详情，请参阅论文原文。

原创 2022-11-07 15:37:05 · 1075 阅读 · 2 评论
【论文阅读】MFAN: Multi-modal Feature-enhanced Attention Networks for Rumor Detection --- 多模态，谣言检测，注意力机制

【论文阅读】IJCAI 2022 论文：MFAN: Multi-modal Feature-enhanced Attention Networks for Rumor Detection。关键点：谣言检测，虚假新闻检测，多模态学习，视觉处理，自然语言处理，社交网络数据挖掘。注意：本博客系博主根据个人理解所写，非逐字逐句翻译，预知详情，请参阅论文原文。

原创 2022-10-31 19:40:30 · 3463 阅读 · 11 评论
【论文阅读】InfoSurgeon: Cross-Media Fine-grained Information Consistency Checking for Fake News Detection

本博客系博主根据个人理解所写，非逐字逐句翻译，预知详情，请参阅论文原文。论文标题：InfoSurgeon: Cross-Media Fine-grained Information Consistency Checking for Fake News Detection

原创 2022-07-13 11:20:59 · 662 阅读 · 0 评论
【论文阅读】Neural Transformation Learning for Deep Anomaly Detection Beyond Images 异常检测，可学习变换，时间序列，表格数据

本博客系博主阅读论文之后根据自己理解所写，非逐字逐句翻译，预知详情，请参阅论文原文。论文标题：Neural Transformation Learning for Deep Anomaly Detection Beyond Images；

原创 2022-05-29 16:45:25 · 774 阅读 · 0 评论
【论文阅读】Probabilistic Embeddings for Cross-Modal Retrieval CVPR 2021 --- 跨模态检索，概率嵌入，一对多，多对多匹配

CVPR 2021 论文 Probabilistic Embeddings for Cross-Modal Retrieval 阅读笔记。本博客非论文的逐字逐句翻译，乃博主阅读论文之后根据自己的理解所写，预知详情，请参阅论文原文。

原创 2022-03-22 17:07:42 · 2200 阅读 · 3 评论
【论文阅读】learning with noisy correspondence for cross-modal matching ------ 跨模态匹配，噪声对应

阅读NIPS 2021论文Learning with Noisy Correspondence for Cross-modal Matching。本文提出了一个跨模态匹配中一直存在但是没有被认真研究过的问题：noisy correspondence：现存数据集中图像-文本配对也许并不match，尤其是从网上爬取的图像-文本配对，很可能是mismatch的。用这样的数据训练跨模态模型显然是有问题的。本文方法能够自适应地划分clean和noisy数据，并纠正noisy的配对样本，得到更具鲁棒性的跨模态匹配模型

原创 2022-03-08 11:17:57 · 7137 阅读 · 1 评论
【论文阅读】Representation Learning with Multiple Lipschitz-constrained Alignments on Partially-labeled

论文阅读：Representation Learning with Multiple Lipschitz-constrained Alignments on Partially-labeled Cross-domain Data；有关domain adaptation，域适应，领域自适应，跨域学习；利普希茨连续性

原创 2022-03-02 16:54:48 · 2064 阅读 · 0 评论
【论文阅读】Attention Bottlenecks for Multimodal Fusion---多模态融合，音视频分类，注意力机制

本文任务是视频分类，方法是多模态视觉（图像）和音频融合。主要是对transformer结构中attention层进行修改，使之可以处理多模态信息，且降低计算量。本博客系本人阅读该论文，结合个人理解所写，非逐句翻译，欲知文章详情，请参阅论文原文。...

原创 2022-03-01 16:55:36 · 13518 阅读 · 15 评论
【论文阅读】CLIP：Learning Transferable Visual Models From Natural Language Supervision ------ 多模态，视觉，预训练模型

本博客的作用是，预习CLIP。在阅读CLIP文章前可以对文章的内容有个整体的认识，有利于阅读过程中充分理解CLIP。讲解CLIP的文章和博客已经非常多了，因此本博客不再逐字逐句解释或者翻译本文的主要内容，而是主要记录一些关键点，包括博主在初次阅读这篇文章时所遇到的问题，以及难以理解透彻的地方。故本博客以问答形式展开。

原创 2022-02-21 11:38:38 · 7218 阅读 · 2 评论
【论文阅读】Hierarchical Multi-modal Contextual Attention Network for Fake News Detection --- 虚假新闻检测，多模态

本博客系本人阅读该论文后根据自己理解所写，非逐句翻译，欲深入了解该论文，请参阅原文。论文标题：Hierarchical Multi-modal Contextual Attention Network for Fake News Detection；关键词：社交媒体，虚假新闻检测，多模态学习；作者：Shengsheng Qian，Jinguang Wang，Jun Hu，Quan Fang，Changsheng Xu；中国科学院大学，中国科学院模式识别国家重点实验室；合肥工业大学；发表会

原创 2021-11-23 17:41:29 · 7287 阅读 · 7 评论
【论文阅读】Multimodal Fusion with Co-Attention Networks for Fake News Detection --- 虚假新闻检测，多模态融合

本博客系本人理解该论文之后所写，非逐句翻译，预知该论文详情，请参阅论文原文。论文标题：Multimodal Fusion with Co-Attention Networks for Fake News Detection；作者：Yang Wu, Pengwei Zhan, Yunjian Zhang, Liming Wang, Zhen Xu；中国科学院大学；出处：ACL 2021；摘要：靠人工识别谣言是费时费力的，所以急需自动识别谣言的模型。但是现有谣言检测模型在融合多模态特征方面

原创 2021-11-21 22:32:53 · 10301 阅读 · 37 评论
【论文阅读】An Introduction to Image Synthesis with Generative Adversarial Nets --- 文本to图像，图像to图像生成，图像合成

论文原文链接：本博客根据博主对本论文的阅读和理解所写，重点关注个人理解方便，非逐句翻译，望周知。如需深入了解论文详情，请阅读原文。作者：He Huang, Philip S. Yu(University of Illinois at Chicago) and Changhu Wang (ByteDance AI Lab)；发表位置：Arxiv 2018；摘要：GAN在许多领域展现出强大能力，比如计算机视觉和NLP。在众多GAN的应用中，image synthesis是研究地最深入的领域，充.

原创 2021-10-31 21:54:39 · 987 阅读 · 0 评论
【论文阅读】A Survey of Image Synthesis Methods for Visual Machine Learning --- 图像生成，计算机视觉

论文原文地址：https://onlinelibrary.wiley.com/doi/epdf/10.1111/cgf.14047本文是对现存image synthesis方法的一个综述。摘要：为机器学习应用所设计的image synthesis提供了一种方法：有效地生成高质量的图像训练数据，同时控制生成过程，以提供图像的最佳分布和图像内容的多样性。随着深度学习应用的发展，合成数据在训练pipeline中很有可能成为非常重要的部分。最近一段时间，大量的训练数据生成方法被提出。image synthe

原创 2021-09-17 16:04:12 · 894 阅读 · 0 评论
camel论文阅读笔记《Camel: Content-Aware and Meta-path Augmented Metric Learning for Author Identification 》

前几天读了18年的这篇文章《Camel: Content-Aware and Meta-path Augmented Metric Learning for Author Identification 》，将自己的阅读笔记分享给大家，共同学习共同进步！这篇文章主要介绍的是作者识别（author identification）问题。作者识别问题是指基于某个T时间之前的所有论文（p...

原创 2018-05-26 11:26:27 · 1087 阅读 · 2 评论

论文阅读笔记

作者: me_yundou

【论文阅读】Tabular Insights, Visual Impacts: Transferring Expertise from Tables to Images - 表格，图像分类，跨模态迁移

【论文阅读】NIPS 2023 Connecting Multi-modal Contrastive Representations 多模态表征，跨模态对比学习表征，图像，文本，音频，3D

【论文阅读】Multi-Modal Sarcasm Detection via Cross-Modal Graph Convolutional Network 嘲讽检测，多模态，跨模态，图神经网络

【论文阅读】跨域推荐系统相关论文学习

【论文阅读】Emphasizing Complementary Samples for Non-literal Cross-modal Retrieval 图文检索 多模态

【论文阅读】Polysemous Visual-Semantic Embedding for Cross-Modal Retrieval 多义性 视觉-语义编码 跨模态检索 视频 图像 文本

【论文阅读】Embracing Domain Differences in Fake News: Cross-domain Fake News Detection using 多模态数据

【论文阅读】Anti-Forgery: Towards a Stealthy and Robust DeepFake Disruption Attack viaAdversarial Percept

【论文阅读】MFAN: Multi-modal Feature-enhanced Attention Networks for Rumor Detection --- 多模态，谣言检测，注意力机制

【论文阅读】InfoSurgeon: Cross-Media Fine-grained Information Consistency Checking for Fake News Detection

【论文阅读】Neural Transformation Learning for Deep Anomaly Detection Beyond Images 异常检测，可学习变换，时间序列，表格数据

【论文阅读】Probabilistic Embeddings for Cross-Modal Retrieval CVPR 2021 --- 跨模态检索，概率嵌入，一对多，多对多匹配

【论文阅读】learning with noisy correspondence for cross-modal matching ------ 跨模态匹配，噪声对应

【论文阅读】Representation Learning with Multiple Lipschitz-constrained Alignments on Partially-labeled

【论文阅读】Attention Bottlenecks for Multimodal Fusion---多模态融合，音视频分类，注意力机制

【论文阅读】CLIP：Learning Transferable Visual Models From Natural Language Supervision ------ 多模态，视觉，预训练模型

【论文阅读】Hierarchical Multi-modal Contextual Attention Network for Fake News Detection --- 虚假新闻检测，多模态

【论文阅读】Multimodal Fusion with Co-Attention Networks for Fake News Detection --- 虚假新闻检测，多模态融合

【论文阅读】An Introduction to Image Synthesis with Generative Adversarial Nets --- 文本to图像，图像to图像生成，图像合成

【论文阅读】A Survey of Image Synthesis Methods for Visual Machine Learning --- 图像生成，计算机视觉

camel论文阅读笔记《Camel: Content-Aware and Meta-path Augmented Metric Learning for Author Identification 》

【论文阅读】Emphasizing Complementary Samples for Non-literal Cross-modal Retrieval 图文检索多模态

【论文阅读】Polysemous Visual-Semantic Embedding for Cross-Modal Retrieval 多义性视觉-语义编码跨模态检索视频图像文本