- 博客(28)
- 资源 (45)
- 收藏
- 关注
原创 【翻译】Computer Vision for Autonomous Vehicles:Problems,Datasets and State-of-Art
自动驾驶计算机视觉研究综述:难题、数据集与前沿成果摘要:近年来计算机视觉、机器学习和自动驾驶等人工智能相关领域发生了惊人的进展。然而,和每一个飞速发展的领域一样,人工智能领域也出现了业内人员难以跟上行业节奏或者业外人员难入行的问题。虽然已经有人发表了几篇关于这方面的专题调查论文,但是到目前为止,还没有关于自动驾驶计算机视觉(computer vision for autonom
2017-06-28 21:32:30 2476 1
原创 学习:Ubuntu14.04编译caffe问题记录
问题一:libunwind.so.8: undefined reference//usr/lib/x86_64-linux-gnu/libunwind.so.8: undefined reference to `lzma_index_end@XZ_5.0' //usr/lib/x86_64-linux-gnu/libunwind.so.8: undefined reference
2017-06-27 21:43:21 2706
原创 【笔记】SSD: Single Shot MultiBox Detector
SSD是ECCV 2016的一篇来自UNC Chapel Hill(北卡罗来纳大学教堂山分校)Wei Liu大牛的Paper:SSD 论文:http://arxiv.org/pdf/1512.02325v2.pdf SSD 代码:https://github.com/weiliu89/caffe/tree/ssdSSD ppt:https://docs.google.com/presentat...
2017-06-25 20:54:22 1059
原创 【笔记】Faster-R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
论文地址:https://arxiv.org/pdf/1506.01497.pdf论文代码:https://github.com/ShaoqingRen/faster_rcnn https://github.com/rbgirshick/py-faster-rcnn 重要:训练文件.prototxt说明:http://blog.csdn.net/Seven_year_Promise/articl...
2017-06-22 22:06:18 1841
原创 【笔记】Fast_R-CNN_ICCV_2015_paper
论文地址:http://arxiv.org/abs/1504.08083代码:https://github.com/rbgirshick/fast-rcnn概要 Fast RCNN是RCNN和SPPnet的改进版。Fast RCNN在训练的时候比RCNN快9倍,比SPPnet快3倍;测试的时候比RCNN快213倍,比SPPnet快10倍。最后在PASCAL VO
2017-06-22 20:48:57 1599
原创 【笔记】SPP-Net : Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
基于空间金字塔池化的卷积神经网络物体检测原文地址:http://blog.csdn.net/hjimce/article/details/50187655作者:hjimce一、相关理论 本篇博文主要讲解大神何凯明2014年的paper:《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Rec
2017-06-22 10:58:15 638
翻译 【翻译】Faster-R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
摘要目前最先进的目标检测网络需要先用区域建议算法推测目标位置,像SPPnet[7]和Fast R-CNN[5]这些网络已经减少了检测网络的运行时间,这时计算区域建议就成了瓶颈问题。本文中,我们介绍一种区域建议网络(Region Proposal Network, RPN),它和检测网络共享全图的卷积特征,使得区域建议几乎不花时间。RPN是一个全卷积网络,在每个位置同时预测目标边界和obje
2017-06-21 10:53:59 723
原创 【相关知识】目标检测之||R-CNN||SPP-NET ||Fast-RCNN ||Faster-RCNN||YOLO ||SSD
1. R-CNN:Rich feature hierarchies for accurate object detection and semantic segmentation技术路线:selective search + CNN + SVMsStep1:候选框提取(selective search)训练:给定一张图片,利用seletive search方法从中提
2017-06-21 10:49:16 1068
原创 【笔记】R-CNN:Rich feature hierarchies for Accurate Object Detection and Segmentation
基于R-CNN的物体检测一、相关理论 本篇博文主要讲解2014年CVPR上的经典paper:《Rich feature hierarchies for Accurate Object Detection and Segmentation》,这篇文章的算法思想又被称之为:R-CNN(Regions with Convolutional Neural Network Features)
2017-06-21 10:48:47 389
原创 Recall || Precision || Average_precision(AP) || Intersection-over-Union(IoU)||NMS
现在做如下的定义: True positives : 真阳True negatives: 真阴False positives: 假阳False negatives: 假阴 Precision 与 RecallPrecision其实就是在识别出来的图片中,True positives所占的比率: 其中的n代表的是(True positiv
2017-06-20 11:48:52 1800
原创 【笔记】YOLO: You Only Look Once:Unified, Real-Time Object Detection
论文下载:http://arxiv.org/abs/1506.02640 代码下载:https://github.com/pjreddie/darknetppt:deepsystems.io 【绝对值得一看的ppt,一看就懂】这是继RCNN,fast-RCNN 和 faster-RCNN之后,rbg(Ross Girshick)大神挂名的又一大作,起了一个很娱乐化的名字:YOLO。 虽然目前版本还...
2017-06-20 11:22:05 1841
原创 【笔记】YOLO9000: Better, Faster, Stronger
YOLO9000: Better, Faster, Stronger论文:https://arxiv.org/abs/1612.08242项目:http://pjreddie.com/darknet/yolo/Caffe:caffe-yolo9000源码解析:https://zhuanlan.zhihu.com/p/25100992http://blog.csdn.net/qq_14839543/...
2017-06-19 20:37:56 1149
原创 产品读书《番茄工作法图解》
精简的PPT 说实话实在不想承认自己有严重的拖延症!!!作为拖延症晚期患者,我总是对网络上分享的效率工具、效率提升方法嗤之以鼻,什么番茄工作法啦,PDCA流程啦,GTD理论啦……总觉得是纸上谈兵,这次突然就想有所行动,外衣灵验了呢~自己也心知肚明是懒癌+拖延症这个大绊脚石挡住了前进的路。抱着自救的心态,我在Kindle里面下载了这本《番茄工作法图解》。内容不多,一下...
2017-06-19 19:00:23 872
原创 「读书」商业的本质
商业的本质是探求真实需求,建立互信的过程。在现代这个移动互联网迅速发展的时候,任何人都没有能力单枪匹马的建立一个商业帝国,要想成就非凡的事业,必须要依靠团队运作,协同合作的力量。那么如何依靠团队来协同完成一件大事呢?答案就是制定一个愿景,然后让团队的每个成员有使命感。要完成使命,那就必须付出是实际行动,最好的使命应该是这样的:即目标远大,又切合实际。
2017-06-18 16:28:06 565
原创 数字图像处理《10、图像分割》
第十章:分割 1、 分割是指将图像细分为构成它的子区域。 2、 多数分割算法基于灰度值的不连续性和相似性:基于不连续性的算法有边缘提取;基于相似性的算法有阀值处理、区域生长、区域分裂和聚合等。 3、 下面介绍四种主要的分割算法: 4、 边缘检测分割:(点检测、线检测、边缘检)首先寻找边缘线段,然后连接为边界,识别区域,进行图像的分割; ...
2017-06-18 16:06:36 916
原创 产品读书《高效能阅读》《深阅读》《如何有效阅读一本书》
有很多人很喜欢读书,但是速度很慢,效率很低,还很有可能读完就忘记,如果在读书的过程中,你遇到:读过就忘、阅读太慢、读书没能增加收入,或者没时间读书等等问题。我最近独到的这三本书《高效能阅读》《深阅读》《如何有效阅读一本书》应该能为你解决这些问题,取其精华,去其糟粕,希望帮助到你~ 高效能阅读这本书的作者原尻淳一,在书中,作者介绍了89种读书技巧,包含了如何快速阅...
2017-06-18 15:52:21 1557
原创 经典卷积神经网络汇总
Lenet,1986年Alexnet,2012年GoogleNet,2014年VGG,2014年Deep Residual Learning,2015年Lenet就从Lenet说起,可以看下caffe中lenet的配置文件(点我),可以试着理解每一层的大小,和各种参数。由两个卷积层,两个池化层,以及两个全连接层组成。 卷积都是5*5的模板,stride=1,池化都是MAX。下图是一
2017-06-18 15:34:04 667
原创 Gan相关知识拓展
《一》、KL散度:理解一:KL散度是用于衡量分布之间的差异程度的,又称为相对熵、信息增益。 概率分布P1和P2的KL散度为: KL(P1||P2)=Ex∼P1logP1P2可以认为是分布之间的“距离”,但是只可以在直观上这样理解,KL散度其实不满足距离的定义:首先它不是对称的;其次不满足三角不等式。在高维空间中如果两个分布不重叠或者重叠部
2017-06-16 11:42:15 347
原创 Generative Adversarial Nets
**译文:**摘要 通过对抗过程来估计生成模型,该过程中同时训练两个模型:生成模型G获得数据分布,判别模型D估计中样本来自训练数据 (而不是G)的概率 。G的训练过程为最大化D犯错的概率。生成模型的估计过程对应一场最小最大的双人游戏。任意函数G和D的空间中,存在唯一解,此时G可恢复训练数据的分布,而D等于1/2。如果G和D定义为多层感知机,那么整个系统可通过反向传播来训练。训练和样本生成时
2017-06-13 15:23:37 1657
原创 数字图像处理《6、彩色图像处理》
图像中引用彩色的原因(1)简化区分目标;(2)人眼可辨别上千种颜色色调和亮度,却只能辨别几十种灰度基础知识彩色图像处理:全彩色处理:数码相机、数码摄像机、彩色扫描仪; 伪彩色图像:对不同的灰度或灰度范围赋以不同的颜色; 描述彩色光的3个基本量:辐射率(radiance):从光源流出能量的总量,用瓦特度量(W); 光强(luminace):观察者从光源接收的能量总...
2017-06-13 11:15:59 2991
原创 global average pooling
下面就介绍一下global average pooling 这个概念出自于 network in network 主要是用来解决全连接的问题,其主要是将最后一层的特征图进行整张图的一个均值池化,形成一个特征点,将这些特征点组成最后的特征向量,进行softmax中进行计算。举个例子假如,最后的一层的数据是10个6*6的特征图,global average poolin
2017-06-13 11:09:01 827
转载 全连接层FC
作者:魏秀参链接:https://www.zhihu.com/question/41037974/answer/150522307来源:知乎全连接层到底什么用?我来谈三点。全连接层(fully connected layers,FC)在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话,全连接层则起到将学
2017-06-13 10:40:25 3334
原创 目标检测与跟踪
Paper https://github.com/foolwood/benchmark_results专栏https://zhuanlan.zhihu.com/visual-tracking?group_id=840232915295170560重要网站链接https://handong1587.github.io/deep_learning/2015/10/09/object...
2017-06-12 22:23:52 1320
原创 Computer Vision for Autonomous Vehicles: Problems, Datasets and State-of-the-Art
摘抄自:http://mp.weixin.qq.com/s/YG5WcKejUi9QlQfjJQZ96w 摘要本文通过提供有关自动驾驶计算机视觉这一主题的最新调查。调查既包括最为相关的历史资料,也包括识别、重建、运动估测、追踪、场景理解以及端到端学习等当前最先进的专业主题。为了完成这一目标,首先通过分类学对每个方法进行分类,接着在 KITTI、ISPRS、MOT 和 Cityscapes 等若干个
2017-06-10 16:19:50 1977
原创 深度学习数据集汇总
1. CIFAR-10 & CIFAR-100CIFAR-10包含10个类别,50,000个训练图像,彩色图像大小:32x32,10,000个测试图像。(类别:airplane,automobile, bird, cat, deer, dog, frog, horse, ship, truck)(作者:Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton)
2017-06-10 15:40:24 1274
原创 Dropout
论文地址:https://arxiv.org/abs/1207.0580Dropout是hintion在他的文章Improving neural networks by preventing co-adaptation of feature detectors(通过阻止特征检测器的共同作用来提高神经网络的性能)提出的Dropout是指在模型训练时随机让网络某些隐含层节点的权重不工作,不工作...
2017-06-10 11:08:34 834
原创 GAN资料汇总
Deep Learning Research Review Week 1: Generative Adversarial Netshttps://adeshpande3.github.io/adeshpande3.github.io/Deep-Learning-Research-Review-Week-1-Generative-Adversarial-Nets深度学习研究总结:生成对...
2017-06-06 20:22:14 1357
管理十诫:影响你一生的管理哲学
2019-05-01
Single Image Dehazing via Multi-Scale Convolutional Neural Networks
2019-04-05
Learning Linear Transformations for Fast Arbitrary Style Transfer论文解读
2019-04-03
粉丝经济:传统企业转型互联网的突破口
2019-01-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人