ANN/DNN/纤维丛
文章平均质量分 62
wishchin
CV算法工程师:从事室内场景感知方面工作,完成算法实验和软件开发。
展开
-
CaffeMFC:caffe.pb.h(2525): error C2059: syntax error : 'constant'
下边的语句会报 syntax error : 'constant'。static const DimCheckMode STRICT = V1LayerParameter_DimCheckMode_STRICT;static const DimCheckMode PERMISSIVE = V1LayerParameter_DimCheckMode_PERMISSIVE排错方法:在STRICT和PE...转载 2018-03-02 15:18:24 · 2336 阅读 · 0 评论 -
最优化方法系列:SGD、Adam
文章链接:Deep Learning 最优化方法之SGD 72615436本文是Deep Learning 之 最优化方法系列文章 整个优化系列文章列表: Deep Learning 之 最优化方法 Deep Learning 最优化方法之SGD Deep Learning 最优化方法之Momentum(动量) Deep Learning 最优化方法之Nest...转载 2018-03-15 17:58:08 · 3762 阅读 · 0 评论 -
场景分割:MIT Scene Parsing 与DilatedNet 扩展卷积网络
FCN中有两个关键,一个是pooling减小图像尺寸增大感受野,另一个是upsampling扩大图像尺寸。在先减小再增大尺寸的过程中,肯定有一些信息损失掉了,那么能不能设计一种新的操作,不通过pooling也能有较大的感受野看到更多的信息呢?答案就是dilated conv。原创 2018-03-16 15:38:29 · 2390 阅读 · 0 评论 -
ubuntu下sudo命令不能使用问题
出现 [sudo ] username !!!之后,在输入一遍 密码,则可以使用sudo 命令。原创 2018-02-24 15:25:12 · 6991 阅读 · 9 评论 -
白盒-CNN纹理深度可视化: 使用MIT Place 场景预训练模型
MIT发文:深度视觉的量化表示................ Places2 是一个场景图像数据集,包含 1千万张 图片,400多个不同类型的场景环境,可用于以场景和环境为应用内容的视觉认知任务。 GitHub源代码:https://github.com/CSAILVision/NetDissect 论文地址:http://netdissect....原创 2018-02-09 17:09:59 · 1591 阅读 · 0 评论 -
Detectron-MaskRCnn: 用于抠图的FCNN
市面上暂时还没有找到可以在消费机显卡上实时运行的MaskRCnn,TensorFlow即使是C++版本训练在coco数据集上的模型也是慢的要死,最后不堪忍受,只能放弃。 经历了一些列fuckingDog的复杂配置之后,终于配置成功了。测试一把 Detectron地址:https://github.com/facebookresearch/Detectron一、...原创 2018-03-04 23:50:38 · 3314 阅读 · 1 评论 -
三维CNN:收集一些最近的3d卷积网络PointNet++
受限于点云本身的无序性,不同设备在不同位置扫描物体所获得的数据不尽相同,数据难以通过端到端方法来处理;点云本身也面临数据缺失的问题,比如被扫描模型往往会被遮挡。 针对无序点云数据的深度学习方法研究,目前进展还相对缓慢。在 CVPR 2017 上,斯坦福大学提出的 PointNet 是第一种直接处理无序点云数据的深度神经网络。团队通过在每个点训练一个 MLP,把每个点投...原创 2018-03-22 18:04:48 · 10052 阅读 · 1 评论 -
Detectron-MaskRCnn:Mask判别和获取前向Mask的标签
对于FCN-SceneParse网络,最后卷积生成N个类别的maps,每个Map都得到图像所有点的单类概率。MaskRCNN的结构与FCN不相同。 参考三个文章: Detectron总结1:Blob的生成 和 generate proposal Detectron总结2:前向生成数据标签的过程 Detectron总结3:参数设置...转载 2018-03-23 13:19:39 · 1393 阅读 · 1 评论 -
实例分割:MaskXRCnn 与Visual Genome数据集
一、VG数据集 机器学习领域的突破突然让计算机获得了以未曾有的高精度识别图像中物体的能力——几乎达到了让人惊恐的程度。现在的问题是机器是否还能更上层楼,学会理解这些图片中所发生的事件。 Visual Genome的新图像数据库有望推动计算机向这一目标挺进,并帮助衡量计算机在理解真实世界这一进程中的进步。教会计算机理解视觉场景是人工智能非常重要的基础。它不仅能产生更多...转载 2018-03-05 18:04:04 · 4682 阅读 · 0 评论 -
caffe2:conda路径和权限问题
在使用conda之后,总是不能直接使用 conda install 命令,需要把codna添加到系统路径,取代默认Python。在~/.bashrc中,添加# added by Anaconda2 installerexport PATH="/home/wishchin/anaconda2/bin:$PATH"source ~/.bashrc出现问题:CondaIOError: ...原创 2018-03-11 14:17:23 · 2025 阅读 · 4 评论 -
CNN结构:场景分割与Relation Network
参考第一个回答:如何评价DeepMind最新提出的RelationNetWork 参考链接:Relation Network笔记 ,暂时还没有应用到场景中 LiFeifei阿姨的课程:CV与ML课程在线论文:A simple neural network module for relational reasoninggithub代码...转载 2018-03-23 14:11:58 · 4697 阅读 · 0 评论 -
MaskRCNN:三大基础结构DeepMask、SharpMask、MultiPathNet
MaskXRCnn俨然成为一个现阶段最成功的图像检测分割网络,关于MaskXRCnn的介绍,需要从MaskRCNN看起。 当然一个煽情的介绍可见:何恺明团队推出Mask^X R-CNN,将实例分割扩展到3000类。 MaskRCnn取得的精细结果有三个主要技术构架:DeepMask、SharpMask、MultiPathNet。MaskRCNN与...转载 2018-03-22 17:45:36 · 3978 阅读 · 0 评论 -
FCN Caffe:可视化featureMaps和Weights(C++)、获取FCN结果
为何不使用C++版本FCN获取最后的分割掩模像素块集合,何必要使用python呢!因此需要获取网络最后层的所有featureMaps,featureMaps的结果直接对应了segmentation的最终结果,可以直接用于掩模分析。 caffe源码给出了提取中间层featureMap的源代码,位置在tools/extract_features.cpp。 参考文章链...原创 2018-03-09 17:45:16 · 1628 阅读 · 1 评论 -
人工机器:机器学习的哲学原理、基础及完备性的来由
观测->假设->归纳->演绎->过拟合,这是ML的一般套路和基础指导准则。 2018年03月11日 14:37:44导言 对于人工智能,有诸多定义,也有诸多质疑。各家的定义不用多追究。从各个领域提出对机器学习的理解,同时也表示出对定义的狭隘理解。从《计算机科学的离散结构》、到《pattern recognition》、...原创 2019-06-17 14:40:27 · 1594 阅读 · 0 评论 -
人工机器:作为归纳系统的深度学习
深度学习为深度神经网络机器学习。07年最先引起注目的是DNN,在语音识别上有突出的表现;深度CNN在机器视觉领域的超常表现引领模式识别领域科学界和工业界的潮流,基于图像数据本身的二维结构天然适合CNN处理;RNN对时序和变长数据的处理优势促使语音识别和视频分析又有较大发展;此外可应用于增强学习的新的深度网络形式可以完成游戏策略训练过程,提供端到端的 模型训练方式:DeepMind用...原创 2017-05-05 15:53:15 · 1062 阅读 · 0 评论 -
深度学习:又一次推动AI梦想(Marr理论、语义鸿沟、视觉神经网络、神经形态学)
几乎每一次神经网络的再流行,都会出现:推进人工智能的梦想之说。前言:Marr视觉分层理论 Marr视觉分层理论(百度百科):理论框架主要由视觉所建立、保持、并予以解释的三级表象结构组成,这就是: a.基元图(the primal sketch)—由于图像的密度变化可能与物体边界这类具体的物理性质相对应,因此它主要描述图像的密度变化及其局部几何关系。 ...原创 2013-12-21 18:41:25 · 1182 阅读 · 0 评论 -
人工机器:Neural Turing Machines(NTM)
NTM通过融合一个注意力处理过程进行交互的外部存储器(external memory),来增强神经网络的能力。新系统等同于图灵机或者冯·诺依曼体系,但每个组成部分都是端到端可微的,因此可以使用梯度下降进行高效训练。初步的结果显示神经网络图灵机能够从输入和输出样本中推理出(infer)简单的算法,如复制、排序和回忆。翻译 2016-11-11 18:42:13 · 12809 阅读 · 3 评论 -
| 一文读懂迁移学习(附学习工具包)
当一个CNN用于另一个领域,就使用到了迁移学习。迁移学习是一种用于模型领域泛化和扩展的工具。 文章链接:独家 | 一文读懂迁移学习(附学习工具包) 参考:当深度学习成为过去,迁移学习才是真正的未来? 知乎:什么是迁移学习?2018年03月15日 17:24:291. 前言迁移学习(Transfer...转载 2019-06-17 14:43:39 · 2374 阅读 · 0 评论 -
三维重建5:场景中语义分析/语义SLAM/DCNN-大尺度SLAM
前言: 在实时/非实时大规模三维场景重建中,引入了语义SLAM这个概念,参考三维重建:SLAM的尺度和方法论问题和三维重建:SLAM的粒度和工程化问题 。大规模三维场景重建的尺度增大,因此相对于整个重建过程的粒度也从点到特征点到目标物体级别,对场景进行语义标记成为重要的工作。场景语义标记的传统方法: 其他:机器人在线场景感知问题,场景识别问题。...原创 2019-06-17 14:41:00 · 8933 阅读 · 0 评论 -
Detectron:Pytorch-Caffe2-Detectron的一些跟进
pytorch官网:http://pytorch.org/上只有PyTroch的ubuntu和Mac版本,赤裸裸地歧视了一把Windows低端用户。1. Caffe源码:Caffe源码理解之存储 Caffe2存储Caffe2中的存储结构层次从上到下依次是Workspace, Blob, Tensor。Workspace存储了运行时所有的Blob和实例化的Net。Blob可以视为对...转载 2018-04-09 15:09:27 · 1538 阅读 · 0 评论 -
CNN:测试一下YoloV3
项目地址:https://pjreddie.com/darknet/yolo/ mAP提升了不少,在VS上试一把 V3 的权值:https://pjreddie.com/media/files/yolov3.weights yolov3-voc的权值: 估计在C...原创 2018-03-27 15:05:56 · 2109 阅读 · 0 评论 -
TF实战:(Mask R-CNN原理介绍与代码实现)-Chapter-8
这篇文章写的挺辛苦,不过对于Mask介绍着墨不多。 文章: TF实战:Chapter-8上(Mask R-CNN介绍与实现) ............................................... MRCNN采用和Faster R-CNN相同的两个阶段,具有相同的第一层(即RPN),第二阶段,除了预测种类和bbox回归,并且并...转载 2018-04-03 15:28:50 · 1146 阅读 · 0 评论 -
AI:IPPR的数学表示-CNN方法
既然人工构建的特征hash函数并不能满足每一个场景的需求,每个经验都有局限,且特征提取的压缩映射必然导致压缩损失,为何不略过此环节,使用数据来完成此过程。越多的数据可生成越精确的分类结果,这就引出了一站式图像处理PR方法——CNN方法。IPPR又从分治法回到一站式方法。原创 2017-07-08 00:15:09 · 1340 阅读 · 0 评论 -
AI:IPPR的数学表示-CNN结构/参数分析
前言:CNN迎接多类的挑战 特定类型的传统PR方法特征提取的方法是固定的,模式函数的形式是固定的,在理论上产生了特定的“局限性” 的,分类准确度可以使用PAC学习理论的方法计算出来。特定函数形式的模式识别准确度、泛化误差都受到模型本身VC维的限制。 使用不受限制的多层网络取代可以有明确语法形式的传统网络,可以突破特征提取和模式函数的固有限制,也导致了模式识...原创 2017-07-12 12:15:02 · 1638 阅读 · 0 评论 -
ZfNet解卷积:可视化CNN模型( PythonCode可视化Cifar10)
由来已久,ANN方法被称为模式识别里面的“黑盒”方法,因为ANN模型不能使用明确的函数——形式化的数学公式进行表示,同时也意味着应对评价模型,面对函数寻求最优解的优化方程也不能形式化表示。好在对于学习来说,形式化是非必须的,可形式化的SVM也面临着核函数的形式化难题,而CNN可以从语义层次进行解析,以弥补语法不能完备的缺憾。翻译 2017-12-25 16:00:00 · 1012 阅读 · 0 评论 -
AI:IPPR的数学表示-CNN结构进化(Alex、ZF、Inception、Res、InceptionRes)
前言: 深度学习:sigmod、tanh、ReLU函数的优缺点-文章图文并举;文章:CNN的结构分析--; 文章:历年ImageNet冠军模型网络结构解析---; 文章:GoogleLeNet系列解读---; 文章:DNN结构演进History—CNN-GoogLeNet :Going Deeper with Convolutions ;文章:Google最新开源Incepti...转载 2019-06-17 14:37:43 · 4207 阅读 · 0 评论 -
AI:IPPR的数学表示-CNN稀疏结构进化(Mobile、xception、Shuffle、SE、Dilated、Deformable)
接上一篇:AI:IPPR的数学表示-CNN基础结构进化(Alex、ZF、Inception、Res、InceptionRes)。 抄自于各个博客,有大量修改,如有疑问,请移步各个原文.....17年的总结...CSDN吞图. 前言:AutoML-NasNet VGG结构和INception结构、ResN...翻译 2019-06-17 14:35:51 · 1598 阅读 · 0 评论 -
DNN结构构建:NAS网络结构搜索和强化学习、迁移学习
前言 谷歌推出的NASNet架构,用于大规模图像分类和识别。NASNet架构特点是由两个AutoML设计的Layer组成——Normal Layer and Reduction Layer,这样的效果是不再需要相关专家用human knowledge来搭建卷积网络架构,直接用RNN把Hyperparameter计算出来,这样就实现了网络结构自动学习。 论文:Learni...翻译 2018-05-14 15:23:20 · 4433 阅读 · 0 评论 -
CNN结构:序列预测复合DNN结构-AcGANs、 ENN误差编码网络
前言:模式识别问题 模式函数是一个从问题定义域到模式值域的一个单射。 从简单的贝叶斯方法,到只能支持二分类的原始支持向量机,到十几个类的分类上最好用的随机森林方法,到可以支持ImageNet上海量1860个类且分类精度极高的InceptionV4(参考:CNNhttp://blog.csdn.net/wishchin/article/details/45286805),其模式...原创 2018-05-22 13:28:30 · 1676 阅读 · 0 评论 -
**ML : ML中的最优化方法
线性规划、整数规划、目标规划等方法其目标函数与约束条件都是决策变量的一次函数,全部为线性规划,具有统一的数学模型及如单纯形法这样的通用解法。1947年丹齐格(G.B.Dantzig)提出了线性规划的一般方法——单纯形法。随后专业丰富了线性规划的数学模型和求解方法,并深入分析细节,如对偶理论、线性目标规划等。关于一般非线性规划优化算法的求解,最优化方法一书已经介绍了很多的方法,比如有梯度下降法,坐标下降法,牛顿法和拟牛顿法,共轭梯度法。而机器学习中主要面对非线性问题,所使用的优化方法为非线性优化方法。原创 2015-12-24 12:28:44 · 3521 阅读 · 0 评论 -
最优化方法系列:Adam+SGD-AMSGrad
自动调参的Adam方法已经非常给力了,不过这主要流行于工程界,在大多数科学实验室中,模型调参依然使用了传统的SGD方法,在SGD基础上增加各类学习率的主动控制,以达到对复杂模型的精细调参,以达到刷出最高的分数。 ICLR会议的 On the convergence of Adam and Beyond 论文,对Adam算法进行了 猛烈的抨击,并提出了新的Adam...翻译 2018-06-05 10:42:21 · 15656 阅读 · 1 评论 -
预测学习:深度生成式模型、DcGAN、应用案例、相关paper
大模型需要更大量的数据,用以拟合更复杂的假设空间。GAN本身可以用于生成数据,在GAN的学习过程中隐藏了弱监督学习和增强学习的思想。下文主要是对GAN应用于NLP进行相关分析,配图不错,摘抄下来,删除掉关于NLP的部分。本文有大量修改,如有疑虑,请移步原文。 文章:深度生成式模型、DcGAN、应用案例、相关paper 其他参考:生成式模型 & 生成...转载 2018-06-05 15:08:54 · 6297 阅读 · 0 评论 -
语义分割:使用关系图辅助图像分割-Capsule Network、IceNet
文章:欲取代CNN的Capsule Network究竟是什么来头?它能为AI界带来革命性转折么?转载 2018-06-06 16:48:35 · 1934 阅读 · 0 评论 -
语音跟踪:信号分解、锁相、鸡尾酒会效应、基于PR的信号分离
NLP中关于语音的部分,其中重要的一点是语音信号从背景噪音中分离。比如在一个办公室场景中,有白天的底噪-类似于白噪音的噪音、空调的声音、键盘的啪啪声、左手边45度7米元的地方同事讨论的声音、右手边1.5米远处同事讨论的声音、打印机的声音。各种声音混杂在一起,从自然人的角度来分别,很容易做到区分各种声音。 以自然人的观点来看,不自觉的感知中使用了空间传播模型和声音模式识...原创 2018-06-01 17:32:14 · 3065 阅读 · 0 评论 -
Learning Face Age Progression: A Pyramid Architecture of GANs
前言 作为IP模式识别的CNN初始模型是作为单纯判别式-模式识别存在的,并以此为基本模型扩展到各个方向。基本功能为图像判别模型,此后基于Loc+CNN的检测模型-分离式、end2end、以及MaskCNN模型,而后出现基于CNN的预测模型-AcGans。 CNN作为一个基本判别式模型简化为数学模型依然为一个函数映射f(x)->y; 基于CNN的检测模型数学模型为 L...翻译 2018-06-19 16:40:44 · 936 阅读 · 0 评论 -
博客需要搬家
太他nia的垃圾了,写完之后点击发布,只保留了前一段,后面的长篇大论全都没了,感情是自动保存草稿的那一段,其他的呢。其他的呢?本地的没有上传上去,这个缓存机制有很大问题,太恶心人了!转移到其他地方吧................原创 2019-06-14 16:52:22 · 883 阅读 · 1 评论 -
个人技术博客的选择:CSDN、博客园、简书、知乎专栏还是Github Page?
文章链接:个人技术博客的选择:CSDN、博客园、简书、知乎专栏还是Github Page? 感觉还是Fuck The Dog!看来还是以后把文章写在本地,然后再上传到CSDN吧。被CSDN的缓存机制坑了几次,得非常注意这次事件才行!!!...转载 2018-06-19 17:21:50 · 4771 阅读 · 0 评论 -
Learning Face Age Progression: A Pyramid Architecture of GANs
前言 作为IP模式识别的CNN初始模型是作为单纯判别式-模式识别存在的,并以此为基本模型扩展到各个方向。基本功能为图像判别模型,此后基于Loc+CNN的检测模型-分离式、end2end、以及MaskCNN模型,而后出现基于CNN的预测模型-AcGans。 CNN作为一个基本判别式模型简化为数学模型依然为一个函数映射f(x)->y; 基于CNN的检测模型数学模型为 L...翻译 2018-06-19 17:44:36 · 4083 阅读 · 0 评论 -
CNN的稀疏结构分析-CVPR2018
文章地址:CVPR2018高效小网络探秘...CVPR2018高效小网络探秘II...本文介绍、梳理和对比高效小网络,包括早期的经典模型SqueezeNet, MobileNet(V1), 和CVPR 2018最新模型ShuffleNet, IGCV2, MobileNetV2, 探究短小精悍的秘密,学习设计理念和技术,回答以下两个问题:题图是ImageNet上的top-1准确率 vs 理论计算量...转载 2018-07-05 18:03:40 · 4367 阅读 · 0 评论 -
DNN结构:CNN、LSTM/RNN中的Attention结构
前言 attention作为一种机制,有其认知神经或者生物学原理: 注意力的认知神经机制是什么? 如何从生物学的角度来定义注意力? 大多数attention (gating) 技巧都可以直接加入现有的网络架构,通过合理设计初始化和训练步骤也可以利用现有网络的预训练参数。这大大扩展了这些技巧的适用范围。 参考此文:Recurrent...转载 2018-07-06 16:48:01 · 18383 阅读 · 9 评论