![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉
文章平均质量分 92
计算机视觉和数字图像处理
女王の专属领地
尼采曰:每一个不曾起舞的日子,都是对生命的辜负!
展开
-
(2023版)斯坦福CS231n学习笔记:DL与CV教程 (11) | 目标检测和图像分割(Object Detection and Image Segmentation)
⚠️ **本节重点内容**:1. 语义分割(Semantic Segmentation)2. 目标检测(Object Detection)3. 实例分割(Instance Segmentation)原创 2024-01-18 11:04:28 · 417 阅读 · 0 评论 -
(2023版)斯坦福CS231n学习笔记:DL与CV教程 (10) | 视频理解(Video Understanding)
⚠️ **本节重点内容**:1. 视频分类2. 3D CNN3. 双流网络4. 循环卷积网络5. 多模态视频理解原创 2024-01-18 11:02:58 · 352 阅读 · 0 评论 -
(2023版)斯坦福CS231n学习笔记:DL与CV教程 (9) | 注意力机制和转换模型(Attention and Transformers)
⚠️ **本节重点内容**:1. attention注意力2. transformer原创 2024-01-17 11:04:15 · 183 阅读 · 0 评论 -
(2023版)斯坦福CS231n学习笔记:DL与CV教程 (8) | 循环神经网络RNN
RNN 在架构设计方面具有很大的灵活性;Vanilla RNNs 虽然简单,但效果不佳;常见的是使用 LSTM 或 GRU:它们的相加相互作用改善梯度流RNN 中的梯度后向流动可以爆炸或消失。爆炸是通过梯度剪切来控制的。消失通过加性相互作用来控制(LSTM)更好/更简单的架构是当前研究的热门话题、以及序列推理的新范式需要更好的理解(理论和经验)。原创 2024-01-16 14:21:42 · 90 阅读 · 0 评论 -
(2023版)斯坦福CS231n学习笔记:DL与CV教程 (7) | 神经网络训练技巧
1. 初始化:激活函数选择、数据预处理、权重初始化、正则化、梯度检查2. 训练动态:监控学习过程、参数更新、超参数优化3. 模型评估:模型集成(model ensembles)、测试、扩增、迁移学习原创 2024-01-15 10:55:21 · 176 阅读 · 0 评论 -
(2023版)斯坦福CS231n学习笔记:DL与CV教程 (5&6) | 卷积神经网络
本章(lecture5)花了很大篇幅介绍了卷积网络发展进程和基础的一些信息,这里不做详细记录,感兴趣可以直接看PPT!我们直接结合第五节的部分内容进入卷积神经网络部分Lecture6。原创 2024-01-14 15:54:40 · 384 阅读 · 0 评论 -
AI_声纹识别综述
声纹识别,也称作说话人识别,是一种通过声音判别说话人身份的技术【比如:微信的语音登录】。从直觉上来说,声纹虽然不像人脸、指纹的个体差异那样直观可见,但由于每个人的声道、口腔和鼻腔也具有个体的差异性,因此反映到声音上也具有差异性。如果说将口腔看作声音的发射器,那作为接收器的人耳生来也具备辨别声音的能力。最直观的是当我们打电话给家里的时候,通过一声“喂?”就能准确地分辨出接电话的是爸妈或是兄弟姐妹...原创 2019-05-01 11:34:05 · 5850 阅读 · 1 评论 -
NYU-Depth数据集
论文:https://cs.nyu.edu/~silberman/papers/indoor_seg_support.pdf数据集地址:https://cs.nyu.edu/~silberman/datasets/nyu_depth_v2.html数据集包含以下几个部分:有标签的:视频数据的一个子集,1449张处理好的有标签和补全深度的。伴随着密集多标签。此数据也已经被预处理,以填补缺...转载 2019-04-14 21:53:55 · 4947 阅读 · 2 评论 -
消失点检测
ppt:https://wenku.baidu.com/view/e3c7cf61ed630b1c59eeb57c.html消失点:https://blog.csdn.net/u013512448/article/details/53290544代码:https://blog.csdn.net/smallflyingpig/article/details/70550715博客:http...原创 2018-10-25 14:54:19 · 1676 阅读 · 0 评论 -
3D计算机视觉
资源1:16篇系列:https://www.cnblogs.com/ironstark/category/759418.html资源2:三维计算机视觉(一)--点云处理综述 - CSDN博客三维计算机视觉(二)--点云滤波 - CSDN博客三维计算机视觉(三)--点云分割 - CSDN博客三维计算机视觉(四)--关键点 - CSDN博客三维计算机视觉(五)--特征描述子 - CSDN博客三维计算机...原创 2018-06-29 08:39:22 · 2051 阅读 · 0 评论 -
图像处理项目资源整理
深度学习项目图像处理领域的代码链接。图像识别,图像生成,看图说话等等方向的代码;图像生成绘画风格到图片的转换:Neural Style: https://github.com/jcjohnson/neural-style图像类比转换:image-analogies :https://github.com/awentzonline/image-analogies根据涂鸦生成图片:Neural Doo...原创 2018-06-28 18:56:09 · 4179 阅读 · 0 评论 -
AI_图像标注:图像标注简介
一. Image Caption任务简介1.传统的计算机视觉任务深度学习在图像领域取得了爆炸式的发展,这些任务的正确率直逼人类水平,可是:2.计算机已经理解图像了吗?这是faster-rcnn的一个目标检测结果,看似结果非常好,可是当我们把这张照片输入到一个计算机里时,它能告诉我们的只是:“这是马,这是人,这是狗”,这远远没有达到计算机已经理解图像这一个判断。我们希望...原创 2018-06-28 18:43:17 · 9851 阅读 · 1 评论 -
图像标注资源汇总
Image captioning 基础入门李飞飞:如何教计算机理解图片 一个曾经爆火的TED演讲,看完也就知道 image captioning是要干嘛了 - 简介:小孩看到图时,能立刻识别出图上的简单元素,例如猫、书、椅子。现如今,计算机也拥有足够智慧做到这一点了。接下来呢?斯坦福大学的计算机视觉专家李飞飞将描绘当今人工智能科技的前沿领域。她和她的团队建立起了一个含有1500万张照片的数据库,并...原创 2018-06-28 16:19:05 · 2587 阅读 · 0 评论 -
图像检索论文汇总
1. Learning High-level Image Representation for Image Retrieval via Multi-Task DNN using Clickthrough Dataarxiv: http://arxiv.org/abs/1312.4740paper: http://legacy.openreview.net/document/90fc8dad-ad0...原创 2018-06-28 09:39:02 · 1981 阅读 · 0 评论 -
Opencv实现车牌识别
OpenCV自学笔记17. 基于SVM和神经网络的车牌识别(一) OpenCV自学笔记18. 基于SVM和神经网络的车牌识别(二) OpenCV自学笔记19. 基于SVM和神经网络的车牌识别(三) OpenCV自学笔记20. 基于SVM和神经网络的车牌识别(四)PPT : https://wenku.baidu.com/view/cd55127502768e9951e7385b.html车牌识别流...原创 2018-06-27 09:53:09 · 2469 阅读 · 0 评论 -
VS2015中OpenCV编程插件Image Watch安装和使用介绍
在VS中用OpenCV进行开发时,调试经常需要去查看当前图像的内容(图像大小,通道数,鼠标所指像元在图像中的行列数和像素值),介绍一个配合VS使用的OpenCV开发神器——Image Watch。该插件现在支持较新版本的vs版本如:vs2012,vs2013,vs2015等。安装下载最新版本Image Watch(ImageWatch.vsix)安装ImageWatch,双击ImageWatch....原创 2018-06-27 09:38:03 · 454 阅读 · 0 评论 -
Mastering OpenCV with Practical Computer Vision Projects
1、书名:《Mastering OpenCV with Practical Computer Vision Projects》2、书下载地址:https://download.csdn.net/download/julialove102123/105019223、代码最新下载地址:https://github.com/QueenJuliaZxx/code4、作者主页:http:/...原创 2018-06-27 09:27:26 · 861 阅读 · 0 评论 -
特征提取(Detect)、特征描述(Descriptor)、特征匹配(Match)的通俗解释
特征匹配(Feature Match)是计算机视觉中很多应用的基础,比如说图像配准,摄像机跟踪,三维重建,物体识别,人脸识别,所以花一些时间去深入理解这个概念是不为过的。本文希望通过一种通俗易懂的方式来阐述特征匹配这个过程,以及在过程中遇到的一些问题。首先我通过几张图片来指出什么是特征匹配,以及特征匹配的过程。图像一:彩色圆圈为图像的特征点图像二:图像一与图像二的匹配:概念理解:什么是特征,什...原创 2018-06-26 22:43:11 · 12666 阅读 · 14 评论 -
计算机视觉---相机几何模型
part1:4个坐标系: 1、世界坐标系(Xw、Yw、Zw) 2、相机坐标系(Xc、Yc、Zc) 3、像平面坐标系(X、Y) 4、像素平面坐标系(u、v)3个坐标变换关系: 1、世界坐标系(Xw、Yw、Zw)->相机坐标系(Xc、Yc、Zc) 2、相机坐标系(Xc、Yc、Zc)->像平面坐标系(X、Y) 3、像平面坐...原创 2018-06-26 22:21:40 · 4935 阅读 · 1 评论 -
Dilated Residual Networks
如何理解空洞卷积(dilated convolution) 『计算机视觉』空洞卷积1. Background 文章原文可在作者主页阅览:Fisher Yu主页 这篇文章实则是作者将何恺明(Kaiming He)博士残差网络Deep Residual Networks与其之前研究的Dilated Convolution相结合的结果。前者是发表于CVPR2016上的《Dee...原创 2018-06-21 22:21:24 · 736 阅读 · 0 评论 -
AI_综述---图像检索任务十年探索历程【TPAMI2018】
【TPAMI重磅综述】 SIFT与CNN的碰撞:万字长文回顾图像检索任务十年探索历程(上篇)【TPAMI重磅综述】 SIFT与CNN的碰撞:万字长文回顾图像检索任务十年探索历程(下篇)PDF下载(上)PDF下载(下)...原创 2018-06-26 21:58:35 · 1774 阅读 · 0 评论 -
数字图像处理《5、图像复原与重建》
第五章:图像复原和重建 1、 图像复原的目的是以预先确定的目标来改善图像; 2、 如果图像退化是因为有噪声,那么用空间域滤波就可以;如果是图像模糊,用频域滤波比较合适。 3、 噪声的主要来源是图像的获取和传输过程,有高斯噪声、瑞利噪声、伽马噪声、指数噪声、均匀噪声、脉冲噪声,还有周期噪声。 4、 空间滤波适合于只存在加性噪声的复原;包含均值滤波...原创 2018-06-02 10:22:59 · 1400 阅读 · 0 评论 -
数字图像处理《9、形态学图像处理》
第九章:形态学图像处理1、图像的腐蚀和膨胀是两个基本的形态学操作,利用一些基于腐蚀和膨胀的形态学算法如边界提取、孔洞填充、凸壳、细化、骨架、裁剪等,可以从输入的图像中,输出感兴趣的特征。...原创 2018-06-28 18:47:11 · 4454 阅读 · 3 评论 -
使用Keras进行深度学习:(五)RNN和双向RNN讲解及实践
本文是全系列中第5 / 7篇:Keras 从入门到精通使用Keras进行深度学习:(一)Keras 入门 使用Keras进行深度学习:(二)CNN讲解及实践 使用Keras进行深度学习:(三)使用text-CNN处理自然语言(上) 使用Keras进行深度学习:(四)使用text-CNN处理自然语言(下) 使用Keras进行深度学习:(五)RNN和双向RNN讲解及实践 使用Keras进...原创 2018-05-16 21:34:44 · 751 阅读 · 1 评论 -
数字图像处理《4、频率域滤波》
引言区域识别:目标或模式;分类:决策理论方法和结构方法;决策理论方法:定量描绘子描述各种模式;结构方法;定型描绘子描述各种模式;模式和模式类模式:描绘子(如特征)的组合;模式类:具有某些共同属性的一族模式,ω1、ω2...ωn, W:模式类数;常用的三种模式组合:向量(用于定量描述)、串、数(用于结构描述);1.模式向量:粗体小写字母x、y、zx = (x1,x2,...xn)T 模式向量中每个分...原创 2018-06-29 11:20:09 · 935 阅读 · 0 评论 -
【计算机视觉必读干货】图像分类、定位、检测,语义分割和实例分割方法梳理
新智元专栏作者:张皓【新智元导读】本文作者来自南京大学计算机系机器学习与数据挖掘所(LAMDA),本文直观系统地梳理了深度学习在计算机视觉领域四大基本任务中的应用,包括图像分类、定位、检测、语义分割和实例分割。本文旨在介绍深度学习在计算机视觉领域四大基本任务中的应用,包括分类(图a)、定位、检测(图b)、语义分割(图c)、和实例分割(图d)。图像分类(image classification)给定...转载 2018-03-11 21:45:51 · 2073 阅读 · 0 评论 -
数字图像处理《7、小波和多分辨率处理》
图像中引用彩色的原因(1)简化区分目标;(2)人眼可辨别上千种颜色色调和亮度,却只能辨别几十种灰度基础知识彩色图像处理:全彩色处理:数码相机、数码摄像机、彩色扫描仪; 伪彩色图像:对不同的灰度或灰度范围赋以不同的颜色; 描述彩色光的3个基本量:辐射率(radiance):从光源流出能量的总量,用瓦特度量(W); 光强(luminace):观察者从光源接收的能量总...原创 2017-12-13 12:52:20 · 1131 阅读 · 0 评论 -
数字图像处理《8、图像压缩》
第八章:图像压缩 1、图像压缩的理论基础:数据和信息是不同的事情,可以理解为数据是信息的表示,因此相同的信息用不同的表示所占的数据空间是不同的,也就是存在冗余数据。冗余数据主要包括编码冗余、时间空间冗余、不相关信息冗余。 2、压缩方法分为有损压缩和无损压缩,基本的压缩方法有:霍夫曼编码、Golomb(戈洛姆)编码、算术编码、LZW编码、行程编码等。 3、以上的...原创 2017-12-12 14:14:40 · 1289 阅读 · 0 评论 -
《一个图像复原实例入门深度学习&TensorFlow》
《一个图像复原实例入门深度学习&TensorFlow—第十篇》训练过程可视化《一个图像复原实例入门深度学习&TensorFlow—第九篇》精简代码、模型持久化、测试结果输出《一个图像复原实例入门深度学习&TensorFlow—第八篇》使用GPU加速《一个图像复原实例入门深度学习&TensorFlow—第七篇》训练网络《一个图像复原实例入门深度学习...原创 2017-11-18 11:28:26 · 820 阅读 · 0 评论 -
数字图像处理《10、图像分割》
第十章:分割 1、 分割是指将图像细分为构成它的子区域。 2、 多数分割算法基于灰度值的不连续性和相似性:基于不连续性的算法有边缘提取;基于相似性的算法有阀值处理、区域生长、区域分裂和聚合等。 3、 下面介绍四种主要的分割算法: 4、 边缘检测分割:(点检测、线检测、边缘检)首先寻找边缘线段,然后连接为边界,识别区域,进行图像的分割; ...原创 2017-06-18 16:06:36 · 940 阅读 · 0 评论 -
数字图像处理《6、彩色图像处理》
图像中引用彩色的原因(1)简化区分目标;(2)人眼可辨别上千种颜色色调和亮度,却只能辨别几十种灰度基础知识彩色图像处理:全彩色处理:数码相机、数码摄像机、彩色扫描仪; 伪彩色图像:对不同的灰度或灰度范围赋以不同的颜色; 描述彩色光的3个基本量:辐射率(radiance):从光源流出能量的总量,用瓦特度量(W); 光强(luminace):观察者从光源接收的能量总...原创 2017-06-13 11:15:59 · 3011 阅读 · 0 评论 -
2017年【计算机视觉+机器学习+人工智能】领域重要会议 汇总
国内/外每年都会举办很多计算机视觉(Computer Vision,CV)、 机器学习(Machine Learning,ML)、人工智能(Artificial Intelligence ,AI)领域相关的很多学术会议和研讨会等。在此把我所知道的2017年国内/外即将举办的CV和ML领域几个会议和研讨会列出来,希望对读者有用。如有其他我遗漏的,还请各位读者留言提醒,我会及时更新的。MMM2017 ...原创 2017-09-13 13:42:55 · 9422 阅读 · 0 评论 -
自动驾驶技术之所需技术
之前读了一些相关的博文和技术类文章,今天来做个大汇总~~ 自动驾驶涉及到的技术:从大方面来说包括硬件和软件 《一》、首先我们来说硬件,有篇论文Development of Steering Control System for Autonomous Vehicle Using Geometry-Based Path Tracking Algorithm:里面详细讲到了需要的硬件: 至...原创 2017-09-03 11:44:14 · 3446 阅读 · 1 评论 -
计算机视觉界期刊
Computer Version & Graphics & MultimediaRank 1:SIGGRAPH: ACM SIGGRAPH Conference (since 1974)CVPR: IEEE Conf on Comp Vision and Pattern Recognition (since 2000)ICCV: Intl Conf on Computer Visi转载 2017-05-02 15:51:48 · 605 阅读 · 0 评论 -
计算机视觉业界牛人
1.cv圈的格局, 按师承关系,总结a tree stucture of cv guys.David Marr----->Shimon Ullman (Weizmann)----->Eric Grimson (MIT) ----->Daniel Huttenlocher (Cornell) ----->Pedro Felzenszwalb转载 2017-05-02 15:47:44 · 1336 阅读 · 0 评论 -
双目视觉【1】
转载:http://blog.sina.com.cn/s/blog_4a540be60102v44s.html1. 双目视觉算法简介1.1. 双目视觉简介双目视觉广泛应用在机器人导航,精密工业测量、物体识别、虚拟现实、场景重建,勘测领域。什么是双目视觉?双目视觉是模拟人类视觉原理,使用计算机被动感知距离的方法。从两个或者多个点观察一个物体,获取在不同视角下的图像,根据图像之间像素的匹配关系,通过三...转载 2017-02-20 14:39:14 · 1561 阅读 · 0 评论 -
Opencv BUG
关于OpenCV的一个bug的解决方法错误:Opencv配置完之后运行一切都很正常,也愉快的弄了一些demo,然而突然有一天,我心血来潮想要在release下运行一下自己的代码,于是出现了一个很美的画面: 输出窗口显示错误信息:0x50AA8B98(opencv_highgui249d.dll) (templat转载 2016-11-13 20:55:44 · 1519 阅读 · 0 评论 -
ubuntu安装Theano+cuda
ubuntu安装Theano+cuda由于学习需要用到GPU加速机器学习算法,需要安装theano+cuda。开源库的一大问题就是:难安装。为了搞好这个配置,我是前前后后花了3天,重装了3次ubuntu重装了5次驱动才搞定。故发此贴,给出最简单安装方法(如果我还记得的话)。因为ubuntu下各种软件依赖关系太多,最好全新ubuntu安装theano和cuda,然后在更新最好是这么做,再多一步都可能...转载 2016-12-09 14:15:26 · 510 阅读 · 0 评论 -
vs2015+Opencv2.4.13配置
先说说我的情况:我的电脑里面之前就已经安装了VS2015和opencv3.1.0并且配置好了可以使用的,由于做项目过程中需要用到2版本进行测试只能再安装(本人不喜欢多余的东西,麻烦的东西),没办法,再装一个,废话少说~我做了这么几个工作:大家都可以试试,建议最后一个方法:(大家情况都不一样,说真的opencv的好多毛病都很奇怪~~~)1、给你们一个链接你可以先按那个流程下来,和VS2015+ope...原创 2017-02-23 20:00:35 · 1836 阅读 · 0 评论 -
Mask R-CNN
论文下载:https://arxiv.org/pdf/1703.06870.pdf 论文翻译:http://weixin.niurenqushi.com/article/2017-03-29/4805787.html项目地址:https://github.com/TuSimple/mx-maskrcnniccv2017的PPT: https://download.csdn.net/do...原创 2017-05-04 11:38:58 · 2540 阅读 · 0 评论