![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
计算机视觉的数学基础
文章平均质量分 80
沈子恒
计算机视觉 自然语言处理 推荐系统 架构设计
展开
-
OCR-PIL.Image与Base64 String的互相转换
1. 基本环境py2: python2.7.13 py3: python3.6.2 PIL: pip(2/3) install pillow, PIL库已不再维护,而pillow是PIL的一个分支,如今已超越PIL2.Convert PIL.Image to Base64 Stringpy2 :先使用CStringIO.StringIO把图片内容转为二进制流,再进行base64编码...原创 2019-11-14 10:08:31 · 2437 阅读 · 0 评论 -
泛函与变分初步(Euler-lagrange条件)
1.前言若偏微分方程复杂或边界条件不规则时,则方程难以求得解析解,不得不求满足近似程度要求的近似解。变分法是常用的近似方法之一,而且,变分法的原理和应用遍及物理学的各个领域。所谓变分法即为泛函的极值问题。2.泛函与泛函的极值2.1 泛函的概念最速落径问题,如图所示。A、B两点不在同一铅垂线,也不在同一高度。一质点在重力作用下无磨擦沿某曲线从A滑到B,求下滑的最短时间原创 2017-02-01 12:36:08 · 40458 阅读 · 9 评论 -
Unet项目解析(2):./src/retinaNN_training.py
项目GitHub主页:https://github.com/orobix/retina-unet参考论文:Retina blood vessel segmentation with a convolution neural network (U-net) Retina blood vessel segmentation with a convolution neural network (U-ne...原创 2018-06-14 19:40:20 · 5630 阅读 · 5 评论 -
Unet项目解析(3): run_testing.py
项目GitHub主页:https://github.com/orobix/retina-unet参考论文:Retina blood vessel segmentation with a convolution neural network (U-net) Retina blood vessel segmentation with a convolution neural network (U-ne...原创 2018-06-14 20:10:03 · 1871 阅读 · 0 评论 -
Unet项目解析(4): ./src/RetinaNN_predict.py
项目GitHub主页:https://github.com/orobix/retina-unet参考论文:Retina blood vessel segmentation with a convolution neural network (U-net) Retina blood vessel segmentation with a convolution neural network (U-...原创 2018-06-15 16:05:31 · 5195 阅读 · 8 评论 -
Unet项目解析(5): 数据封装、数据加载、数据显示
项目GitHub主页:https://github.com/orobix/retina-unet参考论文:Retina blood vessel segmentation with a convolution neural network (U-net) Retina blood vessel segmentation with a convolution neural network (U-ne...原创 2018-06-15 20:59:04 · 6821 阅读 · 2 评论 -
Siamese Network (原理篇)
1. Siamese Network 用途 Siamese网络是一种相似性度量方法,当类别数多,但每个类别的样本数量少的情况下可用于类别的识别、分类等。传统的用于区分的分类方法是需要确切的知道每个样本属于哪个类,需要针对每个样本有确切的标签。而且相对来说标签的数量是不会太多的。当类别数量过多,每个类别的样本数量又相对较少的情况下,这些方法就不那么适用了。其实也很好理解,对于整个数据集...原创 2018-07-26 10:26:48 · 13142 阅读 · 1 评论 -
关于Matconvnet中Conv-ReLU-Pool-NormBatch的总结与思考
最近一直在思考是出国还是找工作的事,和三年前一样又到了做决定的时候。真的很心累,捡起了我的MatConvNet,重新看一了一下牛津派的编程艺术。只有沉浸式的工作,才能安静下来吧。1. vl_nncov - CNN的卷积操作Y = VL_NNCONV(X, F, B)计算图像X与滤波器组F/偏置B之间的卷积操作。如果B是一个空矩阵,就是没有偏置参与;如果F是一个空矩阵,图像并不进行卷积操...原创 2018-07-27 20:57:36 · 3747 阅读 · 2 评论 -
Spatial Pyramid Pooling(空间金字塔池化)-变尺度CNN训练
1. 需求创造好的产品,产品拓宽原始的需求当前的深度神经网络一般都需要固定的输入图像尺寸(如224*224). 这种需求很明显是人为的,潜在性的弊端会降低识别精度(为了使图像尺寸相同,一定会涉及到图像的比例/非比例放缩,这就引入了尺度误差和形变误差)。何凯明师兄的这项工作主要是讲多分辨率搜索的思想融入到了现有的深度网络中,从而实现了多尺度网络的训练以及识别,进而提升了图像分类和目标检测的精度(...原创 2018-09-08 16:13:37 · 26256 阅读 · 0 评论 -
透彻理解RPN: 从候选区域搜索到候选区域提取网络
在目标检测、目标跟踪领域,提取region proposal都是最基本环节。本文概述了从 sliding window 到 selective search, 然后升级到 region proposal network的过程。 核心在于理解 selective search算法 和 region proposal network的设计思想。1. 从sliding windo...原创 2018-10-30 16:33:47 · 33268 阅读 · 6 评论 -
自编码器深度分析+定制特征描述子构建初探
1. 关于tailored 特征描述子 自从深度学习的繁荣,利用自编码器、孪生网络、对抗网络采用数据驱动的形式设计tailored 特征描述子 成为了计算机视觉领域发展的重要推动力, 这不仅大大削弱了特征工程的压力,而且降低了相关领域学者对于数学基础的要求。 本博文重点在于介绍自编码器在tailored feature方面的潜力。2. 什么是自编码器(Autoencoder)...原创 2018-11-26 12:06:09 · 2368 阅读 · 2 评论 -
Tensorflow数据读取机制及tfrecords高效读取数据
1. tensorflow 的数据读取机制以图像数据为例,数据读取过程如下所示: 假设我们的硬盘中有一个图片数据集0001.jpg,0002.jpg,0003.jpg……我们只需要把它们读取到内存中,然后提供给GPU或是CPU进行计算就可以了。这听起来很容易,但事实远没有那么简单。事实上,我们必须要把数据先读入后才能进行计算,假设读入用时0.1s,计算用时0.9s,那么就意味...原创 2018-12-12 22:29:05 · 6495 阅读 · 4 评论 -
特征层次分析、视觉特征语义探索(微调+预训练)
1. 关于卷积运算、密集连接层、池化与小样本密集连接层与卷积层的根本区别在于,密集连接层从输入特征中学到的是全局模式,在计算机视觉领域对应着的是高级语义特征(全局模式就是涉及所有像素的模式,如 狗,耳朵,向日葵等)。卷积层学到的是局部模式,学到的就是输入图像二维图像小窗口中发现的模式,对应低级语义特征(局部模式就是卷积覆盖的区域,3*3,5*5...,如边缘、纹理等)。正是因为这样的特性,...原创 2018-12-16 22:36:45 · 11372 阅读 · 1 评论 -
窥探黑盒-卷积神经网络的可视化
这是笔者第N+1次听到专家说,深度学习模型是“黑盒”。这个说法不能说他对,也不能说他错。但是这句话从专家那里说出来,感觉就有点不严谨了,想必专家应该长时间不在科研一线了... 对于某些类型的深度学习模型来说,确实通过可视化中间节点很难获取到直接判别的有效信息,但对于卷积神经网络来说,可不是这样子的。 因为卷积神经网络学习到的表示 learned representation 非常...原创 2018-12-18 19:30:36 · 9714 阅读 · 7 评论 -
林华达视角-概率图模型与计算机视觉
1. 概率模型与计算机视觉上世纪60年代, Marvin Minsky 在MIT让他的本科学生 Gerald Jay Sussman用一个暑假的时间完成一个有趣的Project: “link a camera to a computer and get the computer to describe what it saw”。从那时开始,特别是David Marr教授于1977年正式提出视觉...原创 2019-01-03 22:37:06 · 11745 阅读 · 1 评论 -
状态空间模型(离散)-隐马尔可夫模型数学原理
Hidden Markov Model, HMM.是动态序列模型-离散情况的代表模型。在股票预测和NLP领域都有良好的应用,如:1. Hidden Markov Model - in Mathmatics状态转移矩阵 Transition Probability (以股市运转为例)测度分布矩阵 Measurement Probability(以股市运转为例)2. H...原创 2019-02-14 18:09:54 · 14931 阅读 · 2 评论 -
统计特性和概率估计-1 (数学推导与证明)
probabilistic & estimation:常用分布,共轭特性,最大似然估计,最大后验估计,指数族和自然参数 statistic properties:辅助机器学习算法证明,包括重要的切比雪夫不等式和马尔科夫不等式1. 概率&估计-Probabilistic & Estimation1.1 高斯分布与高阶矩1-D高斯情况:k-D高斯情况:多元高...原创 2019-02-06 23:42:42 · 13265 阅读 · 0 评论 -
统计特性和概率估计-2 (数学推导与证明)
probabilistic & estimation:常用分布,共轭特性,最大似然估计,最大后验估计,指数族和自然参数 statistic properties:辅助机器学习算法证明,包括重要的切比雪夫不等式和马尔科夫不等式2. 统计特性 statistic properties换元后的概率分布函数以及概率密度函数对于向下取整的一些思考 因此,P(Z<z)相对P(...原创 2019-02-07 20:35:04 · 11728 阅读 · 1 评论 -
牛顿迭代优化
引用zhiyong_will博主的工作,仅进行小范围修改http://blog.csdn.net/google19890102/article/details/41087931一、牛顿法概述除了梯度下降法,牛顿法也是常用的的一种优化算法。牛顿法的基本思想是利用迭代点处的一阶导数(梯度)和二阶导数(Hessen矩阵)对目标函数进行二次函数近似,然后把二次模型的极小点作为新的迭代点,并原创 2017-01-12 16:23:13 · 1479 阅读 · 0 评论 -
B样条曲线拟合原理
1.与贝塞尔曲线对比B样条曲线是在Bezier 曲线基础上发展起来的一类曲线,它克服了Bezier 曲线整体控制性所带来的不便,最常用的是二次和三次B样条曲线。2.二次B样条2.1 参数方程已知三个平面离散点P0、P1、P2,由这三点可以定义二次抛物线段,其参数矢量方程形式为:二次B样条曲线参数方程的矩阵形式为:对比着看,原创 2017-01-13 18:51:43 · 46943 阅读 · 31 评论 -
贝塞尔曲线拟合原理
1.什么是贝塞尔曲线?贝塞尔曲线所依据的最原始的数学公式,是早在1912年就广为人知的伯恩斯坦多项式。简单来说,伯恩斯坦多项式可以用来证明,在[ a, b ] 区间上所有的连续函数都可以用多项式来逼近,并且收敛性很强,也就是一致收敛。再简单点,就是一个连续函数,你可以将它写成若干个伯恩斯坦多项式相加的形式,并且,随着 n→∞,这个多项式将一致收敛到原函数,这个就是伯恩斯坦斯的逼近性质。原创 2017-01-13 18:07:53 · 25959 阅读 · 1 评论 -
图像及其表达与性质(上)
1.基本概念1.1 灰度图像表示为两个变量的标量函数f(x,y),其中(x,y)是平面内的坐标。1.2 在很多情况下,图像是作为3D场景到2D投影结果形成的。1.3 数字化图像的定义域是一个有限的离散栅格,其坐标是自然数。数字化图像的值域是一个灰度值(亮度)的离散集合。像素使图像的基本单位。2. 图像数字化2.1 图像数字化可以看做是采样函数与连续函数图像的乘机。2.2 通原创 2016-01-16 11:49:57 · 1203 阅读 · 0 评论 -
图像中的灰度共生矩阵
1.图像共生矩阵的用途纹理特征提取的一种有效方法是以灰度级的空间相关矩阵及共生矩阵为基础的。因为图像中相距(△x,△y)的两个灰度像素同时出现联合频率分布可以用灰度共生矩阵来表示。若图像的灰度定为N级,那么共生矩阵为N*N矩阵,可以表示为M(△x,△y)(g1,g2)。其中,位于(g1,g2)的元素M值表示一个为g1,而另一个灰度为g2的两个距离为(△x,△y)的像素对出现的次数。对粗纹理原创 2016-01-17 16:20:26 · 4787 阅读 · 0 评论 -
矩阵的特征值和特征向量
1.目的:1.1理解矩阵的特征值和矩阵向量的概念及性质1.2会求矩阵的特征值以及特征向量2. 特征矩阵、特征向量的定义及求解3.经典例题4. 讨论由以上讨论可知,对于方阵的每一个特征值,我们都可以求出其全部的特征向量.但对于属于不同特征值的特征向量,它们之间存在什么关系呢?这一问题的讨论在对角化理论中有很重要的作用.对此有结论如下:原创 2016-03-22 11:45:53 · 6811 阅读 · 0 评论 -
不共线三点确定特征平面并求解平面系数
1.基本原理 已知三点p1,p2,p3,求其平面方程,p1=[x1,y1,z1];p2=[x2,y2,z2];p3=[x3,y3,z3];那么求解下面矩阵q行列式就是了:q=[ones(4,1),[x,y,z];p1;p2;p3];detb=det(q);最后令q=0;这里的求解方法是四阶矩阵的行列式求解,可以从三阶矩阵的行列式推导出来,那就是常规的求解方法:方程组写成[p1;p2原创 2016-04-08 16:02:10 · 8415 阅读 · 0 评论 -
空间离散点和合成
1 原理根据空间中的离散点进行直线拟合,其原理很简单,就只最小化众散点到该直线的最小距离。有一个最先要的知识,该直线必过众散点的平均值,那么我们需要做的就是寻找该直线的方向向量。 根据空间几何知识,我们可以知道,利用协方差矩阵的奇异变换,得到的最大奇异值对应的奇异向量就是该直线的方向。2 代码设计%% 根据空间点拟合一条空间直线的思路比较直接,就是最小化这些点到直线的距原创 2016-04-17 21:01:22 · 2453 阅读 · 1 评论 -
空间离散点拟合成空间平面
1.原理空间中的离散点得到拟合平面,其实这就是一个最优化的过程。即求这些点到某个平面距离和最小的问题。我们知道一个先验消息,那就是该平面一定会过众散点的平均值。接着我们需要做的工作就是求这个平面的法向量。根据协方差矩阵的SVD变换,最小奇异值对应的奇异向量就是平面的方向。2.代码设计% 随机生成一组(x,y,z),这些点的坐标离一个空间平面比较近x0=1,L1=2;y0=1,L原创 2016-04-17 21:11:52 · 22602 阅读 · 5 评论 -
一维搜索算法——黄金分割法原理与实现
1.算法原理设目标函数为F(x),则黄金分割算法的实现过程如下:(1)给定初始区间[a1,b1],精度要求tol>0,黄金分割系数T=0.618,k=1。(2)令c1=a1+(1-T)(b1-a1),d1=b1-(1-T)(b1-a1),计算Fc=F(c1),Fd=F(d1)。(3)若b(k+1)-a(k+1) >= tol,转到步骤(4),否则停止搜索,得到的结果为(a(k+1)原创 2016-05-04 21:10:22 · 24437 阅读 · 0 评论 -
几何变换详解
在三维图形学中,几何变换大致分为三种,平移变换(Translation),缩放变换(Scaling),旋转变换(Rotation)。以下讨论皆针对DirectX,所以使用左手坐标系。平移变换将三维空间中的一个点[x, y, z, 1]移动到另外一个点[x', y', z', 1],三个坐标轴的移动分量分别为dx=Tx, dy=Ty, dz=Tz, 即x' = x + Txy'原创 2016-04-21 19:41:26 · 2437 阅读 · 0 评论 -
三维空间几何变换原理[平移、旋转、错切]
原创 2016-04-23 20:09:58 · 18402 阅读 · 3 评论 -
计算机视觉 国际著名研究机构
以下链接是关于计算机视觉(ComputerVision, CV)相关领域的网站链接,其中有CV牛人的主页,CV研究小组的主页,CV领域的paper,代码,CV领域的最新动态,国内的应用情况等等。打算从事这个行业或者刚入门的朋友可以多关注这些网站,多了解一些CV的具体应用。搞研究的朋友也可以从中了解到很多牛人的研究动态、招生情况等。总之,我认为,知识只有分享才能产生更大的价值,真诚希望下面的链接能对转载 2016-09-05 20:13:59 · 3508 阅读 · 0 评论 -
我所理解的协方差矩阵
1.前言看论文的时候又看到了协方差矩阵这个破东西,以前看图像处理的书籍的时候就特困扰,没想到现在还是搞不清楚,索性开始查协方差矩阵的资料,恶补之后决定马上记录下来。2.拼出身—统计学的定义学过概率统计的孩子都知道,统计里最基本的概念就是样本的均值,方差,或者再加个标准差。首先我们给你一个含有n个样本的集合X={X1,…,Xn},依次给出这些概念的公式描述,这些高中学过数学的原创 2016-10-28 14:37:44 · 40924 阅读 · 22 评论 -
深度解析K-L变换 及其 在特征识别中的应用
1.K-L变换定义、意义 K-L变换也常称为主成分变换(PCA),是一种基于图像统计特性的变换,它的协方差矩阵除对角线以外的元素都是零(所以大家也叫它最佳变换),消除了数据之间的相关性,从而在信息压缩方面起着重要作用。在模式识别和图像处理中一个主要的问题就是降维,在实际的模式识别问题中,我们选择的特征经常彼此相关,在识别这些特征时,数量很多,大部分都是无用的。如果我们能原创 2016-10-28 15:56:32 · 26853 阅读 · 3 评论 -
向量和矩阵梯度:标量Hesse矩阵和矢量Jacobian矩阵
原创 2016-12-15 11:33:52 · 2205 阅读 · 0 评论 -
最小二乘拟合曲线证明+正则方程
1.定理及证明2.实例3.参考资料JOHNH.MATHEWS), KURTISD.FINK. 数值方法(MATLAB版)[M]. 电子工业出版社, 2005.原创 2017-01-13 15:43:24 · 4898 阅读 · 0 评论 -
三角剖分算法的数学理解
1.开篇三角剖分是代数拓扑学里最基本的研究方法。 以曲面为例, 我们把曲面剖开成一块块碎片,要求满足下面条件: (1)每块碎片都是曲边三角形; (2)曲面上任何两个这样的曲边三角形,要么不相交,要么恰好相交于一条公共边(不能同时交两条或两条以上的边)拓扑学的一个已知事实告诉我们:任何曲面都存在三角剖分。假设曲面上有一个三角剖分, 我们把所有三角形的顶点总个数记为p(公共顶点原创 2017-02-04 19:15:38 · 10122 阅读 · 0 评论 -
最小二乘抛物线拟合原理及证明
1.定理及证明2.实例原创 2017-01-13 16:04:44 · 7377 阅读 · 0 评论 -
[计算机视觉:算法与应用]学习笔记一:图像形成
1. 2D点可以利用一对值(x,y)来表示,也可以利用齐次坐标来表示,那么什么是齐次坐标?用齐次坐标表示有什么优势?参考:参考百度百科【齐次坐标】# 二维点(x,y)的齐次坐标表示为(hx,hy,h)。由此可以看出,一个向量的齐次表示是不唯一的,齐次坐标的h取不同的值都表示的是同一个点,比如齐次坐标(8,4,2)、(4,2,1)表示的都是二维点(4,2)。# 齐次坐标正常化处理(点的齐原创 2015-12-03 14:11:43 · 3993 阅读 · 0 评论