![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
我的项目
文章平均质量分 93
右边是我女神
笔记仓库
展开
-
Zero-Shot Graph Relation Prediction through Commonsense Knowledge Integration
介绍图像中实体之间的关系预测是SGG中的重要步骤,但是目前的方法无法建模没见过的三元组。本文认为这一问题的根源在于缺乏对常识的推理。因此,本文提出了集成常识的场景关系预测框架。原创 2022-10-26 17:43:52 · 482 阅读 · 1 评论 -
具身智能(Embodied AI)和食品计算
目前的AI都是旁观型的AI。以具体的物体“包”为例,人对于这一概念的理解往往能直击本质,而AI目前仅仅从外观上来判断。人之所以能举一反三,也正是因为理解了本质。在亲身交互中学习到现实世界的各种概念;在真实物理场景下正确执行任务。智能体能够与现实世界交互的过程中,完成学习和理解,这一能力称为具身智能。所需要涉及的任务不再是静态的。原创 2022-09-20 11:32:31 · 1203 阅读 · 2 评论 -
零样本学习&Domain-aware Visual Bias Eliminating for Generalized Zero-Shot Learning
传统的零次学习目的是从可见与不可见的domain中识别图像。最近的方法聚焦于学习一个联合的语义对齐视觉表征来在两个domain中迁移知识,然而这却忽视了semantic-freevisualrepresentation对于缓解偏差认知问题的影响。为了解决这个问题,提出了Domain-awareVisualBiasEliminatingnetwork。什么是semantic-alignedvisualrepresentation?......原创 2022-07-30 12:06:15 · 1114 阅读 · 2 评论 -
SiamCAR:Siamese Fully Convolutional Classification and Regression for Visual Tracking
文章目录AbstractIntroductionProposed MethodFeature ExtractionBounding Box PredictionThe Tracking Phase值得关注的几个问题Q1:输入的图片大小不一?Q2:在两者做相关性之前,如何得到特征图?Abstract通过将视觉跟踪任务分解为两个子问题(像素类别的分类和该像素处的边界框的回归),本文以逐像素的方式提出了全卷积Siamese网络来解决视觉跟踪问题。该框架由两个简单的子网络组成:一个用于特征提取,另一个用于边界原创 2022-05-18 14:07:59 · 3053 阅读 · 2 评论 -
基于骨骼点特征的视频分割任务——花样滑冰视频的动作解析
文章目录项目简介骨骼点特征的提取概述IntroductionMethodtwo-branch multi-stage CNN花样滑冰数据集(MCFS)参考文献项目简介我们的目的是构建一个花样滑冰智能解析系统,解析部分是一个视频分割任务,不过基于的是骨骼点特征,这是该领域尚未涉足的方向。其余部分通过unity完成。骨骼点特征的提取我们的骨骼点特征的提取调用的是OpenPose的API,其能够对每个人提取出25个骨骼点,内容是二维坐标及其置信度的三维特征。我们通过置信度选择最有可能为滑冰选手的一组骨骼点原创 2022-03-27 20:16:26 · 6110 阅读 · 4 评论 -
Double Attention Network Based On Sparse Sampling
文章目录问题及解决方案缺乏考虑帧间相似性回顾I3DConvNet+LSTM3D ConvNetsTwo-Stream NetworkTwo-Stream Inflated 3D ConvNets预测方式所谓的I3D特征是什么?问题的具体描述过拟合分析恶化帧的诞生提出的理由冗余帧无效帧我们的解决方案缺乏全局感受野高层对于有效信息的缺失Double Attention NetworkTransformer思想结构位置编码EncoderMulti-Head Self AttentionSelf Attention原创 2022-03-22 18:27:11 · 2857 阅读 · 1 评论