![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
帅气的小王子
计算机视觉、高性能运算。
展开
-
"NetVLAD"场景识别模型解读
c论文: NetVLAD: CNN architecture for weakly supervised place recognition来源:CVPR 2016应用:NetVLAD是一种场景识别算法,但实际上其不仅仅能应用于场景识别,该网络结构可以对卷积神经网络得到的中间特征进行编码,并实现了BP,因此可以用于其他任何以卷积神经网络为基础的识别或者检索场景,并获得比SIFT等为基础的其...原创 2019-02-24 10:16:28 · 5942 阅读 · 0 评论 -
视频分类算法(《《Learnable pooling with Context Gating for video classification》)
一般的视频理解方法通常对一段视频的间隔帧提取特征,取它们的极大值或均值来代表整段视频的特征,这是一种很简单的视频表示方法,但是容易陷入局部最优解,论文为此探索了一种可学习的池化技巧(learnable pooling techniques),它将多个算法(比如 Soft Bag-of-words, Fisher Vectors, NetVLAD, GRU and LSTM)相结合,共同组成视频特征...原创 2019-02-24 10:22:36 · 5696 阅读 · 0 评论 -
《Query-dependent Aesthetic Model with Deep Learning for Photo Quality Assessment》 论文学习笔记
论文提出了一种“上下文相关”的美学质量评价模型,与以前所不同在于1)放弃手写特征2)不适用统一模型评价所有图片3)不依赖其他辅助信息,不针对特定类别网络设计:网络有三个卷积层,俩个全连接层,设计的十分简单,但效果要比复杂的网络还好,原因在于两点:1)卷积核较大,输入尺寸较大,较好的展现了图像的局部整体信息。2)全连接层接第二层卷积层,得以保留部分全局信息。究其原...原创 2019-02-24 10:26:45 · 306 阅读 · 0 评论