CV
文章平均质量分 57
kmyfoer
恶的风景阿克苏刘德华的发挥的风景地方哈哈啥的减肥哈克的的空间发挥空间的刷复活的收费
展开
-
读书笔记:Large-scale Vedio Classification with Convolutional Neural Networks
主要点:一是设计了不同结构的CNN来学习视频分类。二是设计了一种加速训练的方法。不同结构的CNN修改网络结构以加速训练不同结构的CNNSingle Fusion : 和图片分类没有区别 Early Fusion : 在第一层的卷积中,就直接将输入帧全部融合,相当于将卷积扩展为三维。 Late Fusion : 每隔一定的帧数,抽取两帧,每帧的处理步骤...原创 2018-06-19 14:22:55 · 647 阅读 · 0 评论 -
读书笔记:Beyond Short Snippets: Deep Networks for Video Classification
主要关注两个点:如何获取视频全局上的表达(考虑更长的时序上的信息),在获取全局表达时如何避免冗余的计算量(相比3D卷积核直接应用在所有frame stacks)。主要工作Feature Pooling ArchitecturesLSTM Architecture其他主要工作 论文中讨论了两种方法,一种是提取每一帧的深度卷积特征,再使用不同的pooling...原创 2018-06-20 16:16:13 · 761 阅读 · 0 评论 -
常用传统图像处理方法总结
1. 边缘提取1.1 微分算子检测边缘一阶算子:一阶导数的极大值点二阶算子:二阶导数的过零点一阶算子: Prewitt算子 , sobel算子(给四邻域更大的权重)二阶算子代表:拉普拉斯算子但拉普拉斯算子二阶导对噪声非常敏感,通常配合滤波器同时使用(高斯拉普拉斯:形状如同倒扣的帽子)。1.2 Canny边缘检测器最常用的边缘检测方法。能够噪声抑制,边缘增强,边缘定位。算法分为三步...原创 2019-02-19 14:11:07 · 7250 阅读 · 0 评论 -
静态目标检测网络架构发展
图像中目标检测的任务是分类+定位,所以与CNN基础架构相比,有以下几个针对性改进:输出结构包含两部分:该目标属于某个类别的置信度,该目标的最小外接矩形输入不是全图,而是候选目标区域(object proposal)深度目标检测算法(网络架构)的发展历程:R-CNN -> Fast R-CNN -> Faster R-CNN -> FCN -> YOLO -&g...原创 2019-02-24 22:32:21 · 1093 阅读 · 0 评论