6.9日 : 听了前瞻实验室毕业生经验交流分享,师兄师姐所做的研究很扎实,干货很多,所以在周末就读了一篇做计算机视觉的博士师姐的文章。
论文初读,理解错了忘指正。
文章题目: Enhancing Video Event Recognition Using Automatically Constructed Semantic-Visual Knowledge Base
文章所要解决的问题: Video Event Recognition 视频事件识别。师姐在讲座的时候讲的是看“视频”说话,所以我认为 这是一篇描述视频事件的工作,看到后面才知道不是,依然是比较经典的分类问题,事件是一个标签?
在NLP领域也有事件识别的子领域,之前在做事件识别的时候,也关注到了FrameNet数据语料信息,同样地,这篇文章为了结合文本领域的知识,也用到了FrameNet数据语料,不过主要用到的是,通过查询 concept ,得到对应的 Frame与Lu,并在wordnet数据语料上找到所有包含Lu的syns

本文介绍了如何使用自动构建的语义-视觉知识库来增强视频事件识别。通过结合FrameNet和WordNet数据,将视频特征提升到语义层面,提高事件识别的准确性。实验对比了高阶语义特征与低级视觉特征的效果,并涉及ImageNet的迁移学习应用。
最低0.47元/天 解锁文章
204

被折叠的 条评论
为什么被折叠?



