多模态VQA24

Notion – The all-in-one workspace for your notes, tasks, wikis, and databases.

1 VQA痛点(领域问题)

1.1对各个模态之中的语义信息进行有效的挖掘;embedding & knowledge injection & extraction

1.2建立各模态之间的准确关联和对齐;alignment

1.3高效地融合模态信息和答案推理。Fusion & inference

2 RS-VQA痛点(针对遥感)

2.1在RSVQA数据集中没有对象注释,这使得模型很难利用信息区域表示。小痛点,attention解决

2.2在RSVQA任务中,每个图像都有不同难度的问题。 直接用随机顺序的问题训练模型可能会混淆模型并限制性能。Easy 2 Hard inference 标注形式,问题塑造解决

2.3 难标注问题,语义信息获取不直观 & 长尾问题。(种类和QA形式,例如:Yes/No

2.4 RSVQA要从驳杂的遥感图像中提取信息,非专家可以直接获得高阶信息。RSVQA实际价值,小小点)

2.5数据集缺乏多样性,且多为半自动标注。(数据集驱动)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值