人工智能项目实践
NuerNuer
这个作者很懒,什么都没留下…
展开
-
记录之Learning Deep Features for Discriminative Localization阅读
这篇文章有两个重要概念:1.弱监督物体定位(Weakly-supervised object localization)2.可视化卷积神经网络文章的作法是,将最后一个卷积层的输出做一个加权融合,那么这个加权融合的权从何来呢,主要是利用全局池化策略,将一个(N,C,W,H)的特征图FM池化为T,(N,C,1,1)进一步变为T1,(N,C)即可做全连接操作。全连接层的参数形式为(C,num_class),我们所要的权即为被划分的类别所对应的参数L,(C,1),然后与特征图(N,C,W,H)加权融合得原创 2020-07-01 14:12:17 · 175 阅读 · 0 评论 -
记录 之 最近阅读的动作识别(action recognition)工作
C3D:https://www.jianshu.com/p/09d1d8ffe8a4TSM:https://zhuanlan.zhihu.com/p/66251207S3D:https://blog.csdn.net/SIGAI_CSDN/article/details/85098096I3D、TSN:https://zhuanlan.zhihu.com/p/58355093介绍:其中C3D是3d卷积的比较有意义的开端,I3d在C3D之后做了一系列研究,包括引入双流网络,和LSTM网络,原创 2020-07-01 13:49:50 · 361 阅读 · 0 评论 -
Fast R-CNN 个人理解
Fast R-CNN是在R-CNN的基础上进行的改进,大致框架是一致的。总体而言,Fast R-CNN相对于R-CNN而言,主要提出了三个改进策略:1. 提出了RoIPooling,避免了对提取的region proposals进行缩放到224x224,然后经过pre-trained CNN进行检测的步骤,加速了整个网络的learning与inference过程,这个是巨大的改进,并且RoIPo...原创 2019-11-13 15:43:24 · 157 阅读 · 0 评论 -
利用tensorflow建立简单的神经网络所需要的几条简单语句
1.tf.placeholder(tf.float32,[None,N])#为训练集设置占位符,N为图像数据的总大小或标签的总大小2.tf.reshape(x,[batch,in_height,in_weight,channels])#将训练数据整理为卷积所需要的大小格式3.tf.Variable(tf.truncated_normal(shape,stddev = 0.1))#截断正态分布...原创 2019-10-13 20:48:56 · 158 阅读 · 0 评论 -
facenet + Mtcnn 实现人脸识别(实现步骤)
网上关于facenet以及Mtcnn原理的博客有很多,本文便不再赘述,如果有不明白的可以参考该博客http://www.uml.org.cn/ai/201806124.asp。本文更多的是帮助大家使用facenet以及Mtcnn 实现人脸识别功能,这里我们利用的是Github上的一个开源项目,项目链接:https://github.com/davidsandberg/facenet解压后得...原创 2019-05-30 22:10:07 · 4479 阅读 · 2 评论