（十三）：基于深度学习的视觉问答研究_黄同愿

最新推荐文章于 2023-05-22 14:47:57 发布

Laura_Wangzx

最新推荐文章于 2023-05-22 14:47:57 发布

阅读量656

点赞数

分类专栏： “情感分析”研究方向论文-精读总结

本文链接：https://blog.csdn.net/qq_37486501/article/details/116046081

版权

“情感分析”研究方向论文-精读总结专栏收录该内容

88 篇文章 202 订阅 ¥19.90 ¥99.00

订阅专栏

本文综述了视觉问答领域的最新进展，探讨了面临的挑战，如图片标题、视觉问题生成和视觉对话。文章详细分析了卷积神经网络、递归神经网络、特征融合、注意机制、知识与推理以及记忆增强网络在VQA中的应用。此外，还总结了常用数据集和评估指标，并对算法性能进行了比较，展望了未来的研究方向，强调了模型的视觉理解、推理能力和泛化能力的提升是关键所在。

摘要由CSDN通过智能技术生成

文献阅读（十三）：A survey of deep learning-based visual question answering_黄同愿

Abstract
1 Introduction
2 Problems and challenges
3 Visual question answering
4 Data sets and evaluation indicators
- 4.1常用数据集
- 4.2 Evaluation indicators
5 Algorithm performance comparison
6 Directions for future
7 Conclusions

标题：基于深度学习的视觉问答研究综述

Abstract

随着机器学习特别是深度学习的兴起和不断发展，视觉问答领域的研究取得了显著进展，具有重要的理论研究意义和实际应用价值。因此，有必要对目前的研究进行总结，为该领域的研究者提供一些参考。本文对视觉问答领域的相关研究和典型方法进行了详细而深入的分析和总结。
首先介绍了VQA(Visual Question answer)的相关背景知识。
其次，讨论了视觉问答所面临的问题和挑战，并对视觉问答的具体方法进行了展望。
第三，对影响视觉问答的关键子问题进行了归纳和分析。
然后，总结了目前常用的数据集和评价指标。
接下来，针对VQA研究中流行的算法和模型，对算法和模型进行了总结和列举。
最后，对视觉问答的未来发展趋势和结论进行了展望。