- 博客(20)
- 收藏
- 关注
原创 GQA数据集简介
最终构建好的GQA数据集包含22,669,678个问题和113,018张图片,要想回答这些问题,需要模型具有多种的推理技巧和推理步骤。(数据集中覆盖的词汇量有3,097个,答案类型有1,878个。)
2023-03-17 04:06:35
1510
1
原创 Greedy Gradient Ensemble for Robust Visual Question Answering
基于贪婪梯度集成的鲁棒视觉问答算法
2023-03-10 03:52:28
247
原创 Florence: A New Foundation Model for Computer Vision
Florence:计算机视觉的一个新的基础模型
2023-01-05 20:58:22
754
原创 LXMERT: Learning Cross-Modality Encoder Representationsfrom Transformers
LXMERT:学习Transformer的跨模态编码器表示
2022-12-19 05:20:26
648
原创 Towards Robust Visual Question Answering: Making the Most of BiasedSamples via Contrastive Learning
走向鲁棒的视觉问题回答: 通过对比学习,最大限度地利用有偏样本
2022-12-02 03:35:22
597
原创 Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering
图像字幕和视觉问答中的自下而上和自上而下的注意力机制
2022-11-11 03:56:45
1982
3
原创 人工智能深度学习环境搭建
python3.9+CUDA11.3+pytorch1.12.0+tensorflow2.6.0+numpy1.19.5+pandas1.2.4+matplotib3.3.2版本对应关系
2022-07-28 20:43:40
1078
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人