![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CNN
文章平均质量分 90
zcg1942
这个作者很懒,什么都没留下…
展开
-
torch相比于numpy都干了什么——torch入门
https://pytorch.apachecn.org/docs/1.4/blitz/tensor_tutorial.html原创 2023-02-15 18:56:08 · 776 阅读 · 0 评论 -
CV中的经典网络模型——AlexNet和VGG
目标检测目标检测,不仅要识别目标是什么(分类),还要知道目标的具体位置(可以当作回归来做)。RCNNSelective Search 算法获得候选框,Alexnet提取特征,SVM对每个候选框区域打分。对于重叠的区域,通过计算IoU和非极大值抑制,剔除重叠的区域。imagenet到VOC的迁移学习,VOC只有21个类,其中一类是背景。YOLOyou only look once,属于one stage检测,因为不需要提前使用其他的算法获得候选区域。虽然不是显式地找候选框,隐式的也是少不.原创 2020-08-25 16:10:36 · 1826 阅读 · 0 评论 -
即插即用+任意blur的超分辨率重建——DPSR
https://arxiv.org/pdf/1903.12529.pdf原创 2020-07-28 17:05:01 · 1111 阅读 · 0 评论 -
图像分割入门——FCN与U-Net
U-Net解决的是生物医学图像的分割问题。分割问题其实也是分类的一种,只不过是像素级别的分类。为了在同一图像中获得多维的概率,U-Net网络结构使用了全卷积的结构,网络中没有全连接层。对训练图像使用弹性形变进行数据增强。压缩路径中,每次池化之后会进行两次卷积。需要注意的是卷积后的通道数(滤波器个数)是池化之前的2倍。而在压缩路径中则相反,池化变为上采样,通道数变为减半的关系。压缩路径中...原创 2020-03-01 18:05:23 · 497 阅读 · 0 评论 -
Pycharm下安装Tensorflow
趁着帮师妹看Github上的一个项目,督促自己学习一下Python下训练神经网络的一整套流程。没想到在一开头就遇到了不少问题。首先是Pycharm中导入Github项目的问题,还有安装tensorflow的问题,之后又遇到了多种版本的Python共存的问题。在这里记录一下,包括一些开源镜像,方便日后查阅。Justin-Tan实现了一篇文章提出的基于GAN网络压缩图像的目标。原理基本就是生成一幅...原创 2019-01-18 15:40:01 · 7854 阅读 · 1 评论 -
YOLO9000
YOLO9000是YOLO的第三个版本。前两个版本是YOLO v1,YOLO v2,在CVPR2017的文章《Better,Faster,Stronger》中的前半部分都是对前两个版本的介绍,新的内容主要在Stronger部分。YOLO9000中的9000指的是YOLO可以对超过9000种图像进行分类。Better使用Batch normalization有利于收敛和正则化,甚至可以从网络...原创 2018-12-05 17:01:06 · 947 阅读 · 0 评论 -
神经网络相关的笔试题目集合(一)
在找工作的过程中发现好多公司没有专门的、传统的图像处理岗位,所以只能参加算法类的笔试甚至AI类的笔试。在AI的笔试中几乎全是关于神经网络的问题,其实也都是很基础的一些问题,如果事先做了准备,可以从容应对。而对于我这种从传统图像处理算法向深度学习靠拢的新手,不失为一种很好的入门方法。既然是考察神经网络,激活函数activation function作为模拟人脑中神经元之间的激活/抑制的关键,经常...原创 2018-10-15 20:23:43 · 5499 阅读 · 0 评论 -
利用caffe的python接口实现DeepImageSynthesis实例
在之前实现faster rcnn的博客中,先是配置了caffe的python接口,但是在验证的时候用DeepTexture的实例没有成功。改用pycharm而不是jupyter notebook再试一试,毕竟在IDE中更好调试。新建工程,选择anaconda2作为解释器,因为要使用caffe作为模块,所以把编译好的x86/release下的caffe的python版本复制到lib/site-pac...原创 2018-06-27 16:21:19 · 425 阅读 · 0 评论 -
以LeNet-5为例理解CNN
在用caffe实现对MNIST手写数字分类的过程中发现利用的网络是LetNet-5.决定从这个网络入手好好认识一下CNN。LeNet-5早在1998年就出现了(5表示5层模型),标志着CNN的诞生。以其作者YannLeCun的名字命名。但是却没有得到广泛的应用,原因一个是对机器要求高(当时没有GPU),一个是因为其他算法(SVM,老实说是你干的吧?)也能达到类似的效果甚至超过。之后的模型还有Ale...原创 2018-06-11 10:20:14 · 2012 阅读 · 0 评论 -
目标检测必看——RCNN是怎样融合了分类与回归,CNN与SVM
下载链接http://islab.ulsan.ac.kr/files/announcement/513/rcnn_pami.pdfhttp://xueshu.baidu.com/s?wd=paperuri:%286f32e0834ddb27b36d7c5cda472a768d%29&filter=sc_long_sign&tn=SE_xueshusource_2kduw22v&am...原创 2018-05-29 11:05:31 · 2201 阅读 · 0 评论 -
Fater R-CNN 整体把握
在R-CNN中提到过,候选区域的提取和之后的目标检测其实是独立的,所以我们可以使用任意的算法如SS。Fast-RCNN改进的是目标检测部分,但是其实候选区域的提取也挺费时的,Faster R-CNN就把改进方向放在了这里。我们已经领略到了CNN的强大,所以Faster R-CNN把提取候选框的任务也交给神经网络来做。我们把完成这一任务的神经网络叫做Region Proposal Network(R...原创 2018-06-05 11:44:15 · 562 阅读 · 0 评论 -
Caffe中的卷积实现
https://www.zhihu.com/question/28385679https://github.com/Yangqing/caffe/wiki/Convolution-in-Caffe:-a-memo作者贾扬清亲自解释了这个问题。Caffe框架是他在研究生毕业毕业前两个月的时间写的,自然有一些缺点(占用内存方面)。其实卷积是很难优化的,因为我们一般是在单通道的图像和单个滤波器之间进行卷...原创 2018-06-12 11:02:19 · 1094 阅读 · 0 评论 -
Fast R-CNN整体把握
RCNN很好地解决了目标检测分类和定位的问题。但是缺点是速度太慢。原因1:2k个候选区域都要经过变形成统一的正方形才能依次输入CNN进行特征提取。候选区域可能是互相包含的,这就导致原图同一个特征的重复提取。原因2:RCNN的分类和回归是分开的,耗费时间和空间。每个候选区域都要经过相同的CNN和分类+回归,复杂度与候选区域数量成正比。Ross Girshick在15年推出Fast RCNN。同样使用......原创 2018-05-30 11:24:56 · 452 阅读 · 0 评论 -
caffe下matlab、python的配置和faster RCNN的运行
因为自己的电脑没有安装linux环境,显卡也不支持CUDA,所以在实现faster RCNN的demo的过程中还是很麻烦的。完善项目文件下图是vs2013 打开的caffe解决方案的工程目录。由于windows版本caffe的不完善,要先在其libcaffe项目中添加roi_poling层的相关支持。(Fast R-CNN的ROIPooling层需要这个源文件编译)具体做法是对cu&inc...原创 2018-06-22 09:26:27 · 724 阅读 · 0 评论 -
三个数据集与deploy.prototxt
神经网络中经常会出现三种数据集:训练数据集train set、验证数据集validation set、测试数据集test set。对每个训练数据,计算得到准确性,在网络中后向传播误差,从而调整权重weights。对每一个验证数据,也会计算准确性accurary,当准确性达到阈值,就退出训练,这是为了防止过度拟合overfitting。70% should be train cases, 10% w...原创 2018-06-13 11:30:59 · 1186 阅读 · 0 评论 -
windows+caffe下对CIFAR训练
CIFAR是什么CIFAR-10和CIFAR-100都是带标签的大小为8000万小图数据集的子集。其中CIFAR-10有10类,每类6000个大小为32x32的图像。其中训练图像和测试图像的比例是5:1,对每类图像,随机选择1000个测试图像,剩下的就是训练图像。注意到10类图像既有automobile,还有truck。它们是不重叠的。Automobile包含的是轿车,SUV等,truck只包含大...原创 2018-06-14 11:45:04 · 299 阅读 · 0 评论 -
AI人工智能&ML机器学习&DL深度学习
人工智能Artificial Intelligence最早是在1956年提出的。几个计算机科学家在达特茅斯会议上希望能使计算机不仅仅是进行简单的计算,而是可以达到人脑相同的功能。关于人工智能,罗辑思维节目还做过一期节目,里面讲到人工智能一开始被嘲笑,它有多智能,就有多少人工,而且诡异的是,每当人工智能取得一些进步,我们就马上认为这是常规方法得到的结果,从而认定它不算是人工智能了。可见,人工智能还在...原创 2018-06-25 11:05:38 · 631 阅读 · 0 评论 -
LeNet网络配置文件 lenet_train_test.prototxt
.prototxt文件 定义了网络的结构,我们可以通过它了解网络是如何设计的,也可以建立属于自己的网络。这种格式来源于Google的Protocol Buffers,后来被开源,主要用于海量数据存储、传输协议格式等场合。https://blog.csdn.net/liuyuzhu111/article/details/52253491针对xml解析对时间和空间的开销较大的缺点进行了改进,兼容多种语...原创 2018-06-11 21:18:30 · 480 阅读 · 0 评论