自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 读书笔记36:Multi-Objective Molecule Generation using Interpretable Substructures (ICML2020)

此文做的是药物分子生成,重点要解决的问题是multi-objective,也就是说生成的分子要同时具有多个要求的性质。此前的工作大多数都是single-object的,目的只是生成满足某个性质的分子。那么这个性质具体来说都有啥呢?我觉得广义来讲这个性质有很多,好理解的比如生成的药物分子对于某种癌细胞有没有活性(能不能起作用,比如抑制这个癌细胞)。本文选取的性质有两个是对于某种酶是否有抑制作用(GNK3β和JNK3,其他生成分子的工作也经常选取这两个作为目标)。除此之外,还选取了QED和SA,QED是另一篇p

2021-09-04 11:56:45 521

原创 读书笔记35:Random Walk Graph Neural Networks (NeurIPS2020)

paper链接:https://papers.nips.cc/paper/2020/file/ba95d78a7c942571185308775a97a3a0-Paper.pdf本文要做的task是graph分类,核心的方法是设定一组可训练的hidden graph,然后每个输入的graph都会和所有hidden graph对比一下,得到一组similarity score,这一组similarity score也就是输入的graph的representation了,然后可以用简单的fc layer做分

2021-04-18 19:34:07 485

翻译 读书笔记33:SSNet: Scale Selection Network for Online 3D Action Prediction(CVPR2018)

http://openaccess.thecvf.com/content_cvpr_2018/papers/Liu_SSNet_Scale_Selection_CVPR_2018_paper.pdf摘要首先介绍问题,即action prediction(这里括号写了个early action recognition,看后面的介绍好像是和action recognition有区别的,区别在于并不...

2018-10-01 18:19:33 2549 1

翻译 读书笔记31:What have we learned from deep representations for action recognition?(CVPR2018)

http://openaccess.thecvf.com/content_cvpr_2018/papers/Feichtenhofer_What_Have_We_CVPR_2018_paper.pdf摘要:首先是背景,深度模型在计算机视觉的每个领域都有部署,因此,理解这些深度模型得到的representation到底是怎么工作的,以及这些representation到底抓去了什么信息就变得越来...

2018-09-24 18:58:44 712 1

翻译 读书笔记32:PoTion: Pose MoTion Representation for Action Recognition(CVPR2018)

并且http://openaccess.thecvf.com/content_cvpr_2018/papers/Choutas_PoTion_Pose_MoTion_CVPR_2018_paper.pdf摘要首先介绍背景,很多一流的动作识别方法都依赖于two-stream的架构,一个处理appearance,另一个处理motion。接着介绍本文工作,本王呢认为将这两个合起来考虑比较好,引入了一...

2018-09-24 13:17:29 2274 1

翻译 读书笔记30:Recognize Actions by Disentangling Components of Dynamics(CVPR2018)

http://openaccess.thecvf.com/content_cvpr_2018/papers/Zhao_Recognize_Actions_by_CVPR_2018_paper.pdf摘要首先介绍背景:尽管近些年动作识别领域的进展很大,但是其效率还是很有限的,将appearance和motion分别对待的方法常常会有需要大量计算资源计算optical flow的问题;依赖于在原始...

2018-09-20 15:43:46 767

翻译 读书笔记29:A Closer Look at Spatiotemporal Convolutions for Action Recognition(CVPR2018)

http://openaccess.thecvf.com/content_cvpr_2018/papers/Tran_A_Closer_Look_CVPR_2018_paper.pdf本文的摘要开门见山介绍自己的工作,没有背景介绍等铺垫,这和本文的动作内容也有关,本文不是对比前人工作,针对某些不足提出新模型,而是讨论了几种不同形式的spatial temporal convolution模型,...

2018-09-18 16:38:49 3183

翻译 读书笔记28:Compressed Video Action Recognition(CVPR2018)

http://openaccess.thecvf.com/content_cvpr_2018/papers/Wu_Compressed_Video_Action_CVPR_2018_paper.pdf本文的摘要分两段,第一段介绍背景和动机,背景是在video数据上训练robust的representation比在image上要困难得多,一部分原因是原始的video的size是变化的,并且在te...

2018-09-17 22:11:29 2283 2

翻译 读书笔记27:Im2Flow: Motion Hallucination from Static Images for Action Recognition(CVPR2018)

openaccess.thecvf.com/content_cvpr_2018/papers/Gao_Im2Flow_Motion_Hallucination_CVPR_2018_paper.pdf本文的题目可看出,与上一篇读书笔记的文章有很大的相似之处,都介绍了从image中幻想出video,然后利用video的temporal feature进行action recognition。摘...

2018-09-16 19:37:35 762

翻译 读书笔记26:adding attentiveness to the neurons in recurrent neural networks

https://arxiv.org/pdf/1807.04445.pdf摘要首先介绍RNN可以模拟复杂的序列信息的temporal dynamics,但是当前的RNN神经元的结构主要是控制当前信息和历史信息的贡献,但是没有考虑探索input vector中不同元素的重要性(这个指的是某一个时刻的vector的不同dimension的重要性),因此本文提出了element-wise-attent...

2018-09-14 20:12:45 500

翻译 读书笔记25:Temporal Hallucinating for Action Recognition with Few Still Images(CVPR2018)

openaccess.thecvf.com/content_cvpr_2018/papers/Wang_Temporal_Hallucinating_for_CVPR_2018_paper.pdf摘要首先介绍背景,从静态图片中进行动作识别最近被深度学习方法促进,但是成功的方法都需要大量的训练数据,因此不是很实用。但是人类在识别同样的问题就不需要那么多数据,因为人类可以将看到的图片与记忆中看到过...

2018-09-14 18:02:22 925 2

翻译 读书笔记25:2D/3D Pose Estimation and Action Recognition using Multitask Deep Learning(CVPR2018)

http://openaccess.thecvf.com/content_cvpr_2018/papers/Luvizon_2D3D_Pose_Estimation_CVPR_2018_paper.pdf摘要:首先指出背景,即action recognition和human pose estimation是两个紧密相连的领域,但是总是被分开处理。然后自然地引出本文的模型,本文的模型就针对这个现...

2018-09-12 21:06:50 4544

翻译 读书笔记24:Graph R-CNN for Scene Graph Generation

https://arxiv.org/pdf/1808.00191.pdf本文摘要没有介绍背景及他人方法,而是开门见山,指出本文提出了一个新的scene generation model,叫做graph R-CNN。接着介绍这个模型的特点是能够既能高效的检测到图片中的物体,又能有效的抓取物体之间的关系。本文模型包括一个Relation proposal network(RePN),能够高效的解决...

2018-09-11 21:37:43 5286 6

翻译 读书笔记23:Recognizing Human Actions as the Evolution of Pose Estimation Maps(CVPR2018)

http://openaccess.thecvf.com/content_cvpr_2018/papers/Liu_Recognizing_Human_Actions_CVPR_2018_paper.pdf这篇文章和skeleton based action recognition有关系,差别在于这篇文章不使用pose estimation估计好的人体关节坐标值,而是使用pose estima...

2018-09-11 08:44:39 1400

翻译 读书笔记22:Optical Flow Guided Feature: A Fast and Robust Motion Representation for Video Action Recogni

文章题目:Optical Flow Guided Feature: A Fast and Robust Motion Representation for Video Action Recognition(CVPR2018)http://openaccess.thecvf.com/content_cvpr_2018/papers/Sun_Optical_Flow_Guided_CVPR_201...

2018-09-09 21:46:37 1815 1

翻译 读书笔记21:MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition(CVPR2018)

http://openaccess.thecvf.com/content_cvpr_2018/papers/Zhou_MiCT_Mixed_3D2D_CVPR_2018_paper.pdf本文考虑到在识别人体动作的时候,3D CNN的水平不及2D CNN在识别静态图片时的水平,认为这是由于3D CNN消耗的计算资源和存储资源过大导致不能很好的训练,因此在本文中提出了一个2D和3D CNN结合的...

2018-09-09 07:08:57 4838 4

翻译 读书笔记16:A structured self-attentive sentence embedding(ICLR 2017)

https://arxiv.org/pdf/1703.03130.pdf本文在其他文章中被提到过,被称作attentive pooling本文的摘要开门见山,不介绍背景,不介绍别人的工作,直接就说本文提出了一个新的获取可解释的sentence embedding的方法,是通过self-attention实现的。用2D matrix代表embedding,而不是使用vector(由此推测主流...

2018-09-06 08:49:14 1756

翻译 读书笔记15:VAIN:Attentional Multi-agent Predictive Modeling

https://arxiv.org/pdf/1706.06122.pdf摘要:首先介绍背景,multi-agent predictive modeling是理解很多系统的关键;然后一句话介绍现有情况,最近IN模型被提出,用来解决multi-agent physical system,然后指出这个系统的不足是计算量随着interaction的指数变化;之后提出本文提出一个随着agent数量线性变...

2018-09-05 16:19:43 794 1

翻译 读书笔记17:Adversarial Attacks on Neural Networks for Graph Data

https://arxiv.org/pdf/1805.07984.pdf看过之后有一个思考,adversarial attack的目标是事先选定一个class,然后选择攻击方式,尽可能使得模型把样本分类成这个类别,并且class probability和原class的probability拉开差距,但是可不可以将目标设定为最小化原分类class的probability,也就是只将目标定位为使t...

2018-09-05 11:17:33 7753 2

翻译 读书笔记14:Graph networks as learnable physics engines for inference and control(ICML 2018)

原文地址: https://arxiv.org/pdf/1806.01242.pdf此篇文章有supplementary material,有完整的算法,实现,方法的细节,实验的视频摘要部分:首先还是介绍背景,理解并与日常生活中的各种物理场景进行互动需要丰富的关于世界的结构的知识,这些知识或者是用value or policy function来implicitly的表达,或者是expli...

2018-09-01 18:51:17 1523 2

翻译 读书笔记13:Neural relational inference for interacting systems(ICML 2018)

文章地址:https://arxiv.org/pdf/1802.04687v1.pdf摘要部分:摘要的结构和前几篇依然类似,首先是介绍背景:interacting system在自然界中普遍存在,各个组成部分之间的相互作用会引发复杂的行为。然后介绍自己的模型:我们提出了neural relational inference(NRI)模型,是一个无监督的模型,学习相互作用的同时还能仅仅从观察的数...

2018-08-30 16:55:17 3713

翻译 读书笔记11:Attention is all you need

这篇文章引用很多,应该是一篇贡献比较大的。摘要部分:第一句话说现在主流的序列转换模型是基于复杂的循环或者卷积神经网络的,这些网络有一个encoder和一个decoder。然后指出效果最好的模型还会在encoder和decoder之间加上attention机制。接着引出:我们提出了一种简单的新模型,完全不需要循环或者卷积,只用attention就可以。最后介绍了实验结果。这个摘要的结构是首先介绍...

2018-08-29 16:56:12 1750

翻译 读书笔记12:A simple neural network module for relational reasoning

摘要的结构和前两篇读书笔记的论文类似,首先一句话点名背景:relational reasoning是通用智能(generally intelligent behavior)的核心组件,但是神经网络很难学习这种任务。第二句话点明自己的文章是做什么的:在这篇文章中我们描述了如何使用relation networks(RNs)作为一种即插即用的模块来解决一些从根本上依赖于relational reaso...

2018-08-23 20:12:02 1621

翻译 读书笔记10:Non-local Neural Networks

摘要中,作者开门见山,强调卷积神经网络和循环神经网络的操作都是局域化的操作,在本文中,我们提出非局域化的操作(non-local operation),作为抓取长程相互关系的一个一般性的模块(a generic family of building bolcks for capturing long-range dependenices)。也即第一句话给出问题的背景,第二句话概述自己的方法。之后便...

2018-08-22 00:06:35 3499 2

翻译 读书笔记9:Spatio-Temporal LSTM with Trust Gates for 3D Human Action Recognition

传统的LSTM是处理时间序列的,是一个一维的问题,而本文提出了spatio-temporal LSTM,其实就是将一维的LSTM改成了二维的。简介中,可以看出本文是准备探索基于RNN的3D skeleton based action recognition。并且指出本文将把RNN同时延伸到spatio-temporal维度,来同时从两个维度分析数据中的动作信息。受到人体骨架的结构的启发,作者还...

2018-08-18 00:08:20 5211 2

翻译 读书笔记8:Graph Attention Networks(ICLR 2018)

https://mila.quebec/wp-content/uploads/2018/07/d1ac95b60310f43bb5a0b8024522fbe08fb2a482.pdfhttps://arxiv.org/pdf/1710.10903.pdf这是一篇将attention机制应用到graph convolution中的文章。但是文章中提出的模型其实是利用了attention的一部...

2018-08-16 23:42:03 28987 7

翻译 读书笔记7:Relational inductive biases, deep learning, and graph networks

在摘要中,作者就阐明了写作本文的动机,人工智能在近几年由于廉价的数据和计算资源而得到复兴,但是人类智能的很多关键特征,AI还无法实现。具体来讲,作者指的是人类将已有的经验推广的能力还没能在AI中实现,这个能力在后文也被称作combinatorial generalization,也即通过组合已有的东西来获得新的东西。本文的很大一部分是对之前工作的回顾和整合,还有一部分是提出了新的模型。作者在本...

2018-08-16 22:35:06 4487 6

翻译 读书笔记4:Stochastic Training of Graph Convolutional Networks with Variance Reduction

本文提出的背景是:graph convolutional networks(GCN),一层一层的迭代,进行卷积,receptive field随着层数的增加呈指数级扩大,增加了计算负担。之前曾有通过对neighbors进行下采样的方法来减小receptive field的方法,但是不能保证其收敛性,并且receptive field还是很大。本文提出了“control variate based ...

2018-07-30 00:04:41 2757 2

翻译 读书笔记6:Attentive Convolution

从摘要中就可看出,这篇文章针对的问题是NLP这种RNN很擅长,但是CNN不怎么擅长的问题,据此我们猜想,NLP能用,那应该是时间序列之类的问题都可以用,像视频处理,动作识别也都有希望从中借鉴一二。摘要中,作者介绍到:在NLP中,RNN从attention mechanism中获益匪浅,相比之下CNN就没有很好地借此来提升自己的性能。作者认为这个可能是因为CNN中attention mechan...

2018-07-30 00:02:32 2959

翻译 读书笔记5:Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition

这篇文章开篇就指出,我们的模型是要从人体动作的序列中选取出最informative的那些帧,而丢弃掉用处不大的部分。但是由于对于不同的视频序列,挑出最有代表性的帧的方法是不同的,因此,本文提出用深度增强学习来将帧的选择模拟为一个不断进步的progressive process。这篇文章处理的问题是skeleton based action recognition,提出的模型的示意图如下: ...

2018-07-21 17:46:16 5287 3

翻译 读书笔记3:Representation Learning on Graphs with Jumping Knowledge Networks

这篇文章针对的点是:现在的graph上的representation learning的一种方式是neighborhood aggregation,也就是在每一个节点做卷积时,都是将其周围邻居节点的信息聚合在一起。这样做的话,有k层网络,就是将每个节点的k-hop邻近节点的信息都聚合过来了。但是这种策略并不完美,Kipf & Welling在2017年的一篇关于GCN的论文中展示了,两层的...

2018-07-20 23:13:26 5449 2

翻译 读书笔记1:Hierarchical Recurrent Neural Network for Skeleton Based Action Recognition

写这个读书笔记,一方面是为了了解他人的研究,另一方面希望学习科技论文的写作方法,提升自己写paper的水平。原文链接:https://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Du_Hierarchical_Recurrent_Neural_2015_CVPR_paper.pdf下面对文章每个部分的结构和内容进行分析...

2018-05-03 05:57:31 3084 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除