![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法
文章平均质量分 89
zcg1942
这个作者很懒,什么都没留下…
展开
-
torch相比于numpy都干了什么——torch入门
https://pytorch.apachecn.org/docs/1.4/blitz/tensor_tutorial.html原创 2023-02-15 18:56:08 · 776 阅读 · 0 评论 -
泊松融合——用了拉普拉斯但没有金字塔
这样解出来的融合区域的值和参考图不一致,但是梯度近似,且具体的值是基于边界和梯度求解出来的,所以整体会和背景处于同一亮度/颜色水平。但如果参考图对应的mask不够精细,参考图本身的梯度和背景图仍然差异过大,这样的引导场得到的融合效果还是不佳。因为人眼对二阶导是更敏感的,所以只要我们指定了融合区域内部的梯度值,并且知道融合边界处的值,理论上就可以求解出来。上图d使用了参考图和背景图的极大值,相比于b的保守引导场,尽可能保留了更多的纹理信息,不至于在融合区域保留参考图的背景而造成突兀。这样从一阶导到了二阶导。原创 2022-11-04 03:00:00 · 728 阅读 · 1 评论 -
谷歌手机中的HDR技术——HDR+
HDR+手机端的问题手机的光圈小,导致捕获的光线少,从而在暗光下的噪声多;手机用于量化的bit位也少,导致所能表达的动态范围小。算法特点特点之一是不需要使用包围曝光,而使用同一曝光时间,这样有利于对齐,并且曝光时间很短,避免了高光溢出。融合得到的结果没有阴影,高比特位,所以可以应用标准HDR的tone mapping。特点之二是使用bayer raw数据而不是demosaicked后的RGB/YUV数据。这样每个像素的比特数更多,同时也允许我们可以规避ISP中不想要的tone mappi原创 2022-06-04 16:50:14 · 3805 阅读 · 0 评论 -
HDR简单介绍
OpenCV: High Dynamic Range (HDR)OpenCV3.0 HDR(高动态范围)示例代码以及用法 - 一度逍遥 - 博客园High Dynamic Range Imaging — OpenCV 3.0.0-dev documentation可以将动态范围理解为量化的阶数。一般都是8bit量化,那就有256个levels。当同一幅图中同时有高亮和暗部时,就会导致亮度过曝,暗部欠曝。一般处理的方法是使用多张不同曝光的照片,融合得到HDR图。HDR图一般以浮点型表示,对应的文.原创 2022-05-28 22:30:00 · 2188 阅读 · 0 评论 -
位姿估计的来龙去脉——内外参,三维重建,Pnp问题
https://www.jianshu.com/p/b3e9fb2ad0dchttps://blog.csdn.net/luohuiwu/article/details/80722542原创 2021-09-02 10:50:11 · 2364 阅读 · 0 评论 -
二维与三维之间的桥梁——点云
在做图像配准时就听闻过一些点云的方法,确没对其有太多的认识,只是知道点云point cloud顾名思义就是一些离散点的集合。现在在无人驾驶中一些激光雷达的作用其实就是生成点云数据,接下来介绍一下点云数据的含义和基础的使用方法。虽然特斯拉是坚定的纯视觉自动驾驶路线的支持者,但其实更多的无人驾驶公司同时还会使用激光雷达LiDAR。经常见到无人驾驶的车顶会有一个旋转的圆柱体,其实就是机械式激光雷达,通过旋转镜面将激光反射到不同角度,得到360度的数据:转存失败重新上传取消雷达有很多种,激光雷达只是其实原创 2021-07-03 16:21:14 · 1199 阅读 · 0 评论 -
别以为if slse很简单——决策树
熵与Gini指数熵,表示信息量的期望,含义是混乱程度,也是对随机变量编码所需的最小比特数。请参考之前的文章https://mp.csdn.net/editor/html/107641395基尼不纯度,它表示是分错的概率的期望。Gini不纯度其实可以看作是熵的近似值,形式一样没有取对数更容易计算,二分类时,都是概率取0.5时达到最大值。Gini不纯度是一种不等性度量,取值[0,1],当数据完全相等时取0.https://zhuanlan.zhihu.com/p/76667156https:/.原创 2021-03-12 17:34:27 · 379 阅读 · 0 评论 -
XGBoost的安装与介绍
Reference:1.字节跳动架构师https://zhuanlan.zhihu.com/p/303398072.浅谈https://www.jianshu.com/p/d55f7aaac4a7原创 2021-02-26 22:17:28 · 912 阅读 · 0 评论 -
没见过女人的小和尚——SVDD
是的,即便是出生在山上的小和尚,从来没有下过山,没有见过女人,但是一旦有女施主上山,小和尚依然可以轻松地区分出眼前的人是如此不同。传统的SVM是寻找一个超平面,而SVDD寻找的超平面更进一步,可以认为它是闭合的超平面。优化目标是曲面面积最小(即半径最小),约束条件是要使得尽可能多的样本被包含在曲面之中,至于到底需要包含多少,那就要涉及到松弛变量。每个样本都对应一个自己的松弛变量epslon,即对于不同样本的容忍程度可以是不同的,容忍意味着样本可以在一定程度上脱离“包围圈”。最终的优化目标就是R平方的原创 2021-02-22 20:19:57 · 1153 阅读 · 2 评论 -
softmax-sigmoid辨析
指数分布族https://www.zhihu.com/question/29435973原创 2021-01-20 15:49:53 · 657 阅读 · 0 评论 -
DL也懂纹理吗——图像的纹理特征
工作中遇到一个问题:对于同一场景,训练好的DL模型能把大部分样本分类准确,而对于少量负样本,DL会错分到另外一个对立的类中。错分的样本可以认为是难分的样本,但是我们还想知道这两种样本到底是哪里的差异导致DL做出了两种截然不同的判断?回答好这个问题就可以进一步解释DL在分类的过程中到底学习了并依赖了图像的哪些特征。思路是先将这两种样本搜集起来,标签分别为right(分类正确)和wrong(分类出错)。首先可以从直观感受出发,看二者是否有什么明显不同;为了量化这种不同,我们需要从图像中提取一些特征。图像的特原创 2021-01-13 20:31:04 · 277 阅读 · 1 评论 -
JBU联合双边上采样
很多图像处理算法,如立体视觉中的深度估计,图像上色,高动态范围HDR中的tone mapping,图像分割,都有一个共性的问题:寻找一个全局的解,这个解是指一个分段的piecewise平滑含糊,描述了感兴趣的值(可以是深度,色度,曝光值,标签等)。另一方面,数字图像越来越大,从one quarter million到multi-Megapixel到Gigapixel,随着图像尺寸的变大,图像处理的耗时和占用空间也线性增长。一个处理方法就是对原始图像先进行下采样的预处理再进行图像处理,但这也带来一个问题,原创 2020-09-23 14:55:47 · 2219 阅读 · 1 评论 -
深度学习中的信息论——交叉熵
信息量,可以说就是在将信息量化。首先信息的相对多少是有切实体会的,有的人一句话能包含很多信息,有的人说了等于没说。我们还可以直观地感觉到信息的多少和概率是有关的,概率大的信息也相对低一些。为了量化信息,一个做法就是找到一个单位,比如说抛硬币就是一个基本单位,或者说我们使用01编码。先看等概率的情况,种类数越多,那么需要编码的长度就越大,很显然是log的指数关系。因为是等概,所以概率和种类数目就是倒数的关系。那么,不等概的情况呢,其实我们也可以把不等概转换成等概,怎么转换呢,认为要发生的事件A整体是一个类原创 2021-01-21 20:49:25 · 735 阅读 · 1 评论 -
即插即用+任意blur的超分辨率重建——DPSR
https://arxiv.org/pdf/1903.12529.pdf原创 2020-07-28 17:05:01 · 1111 阅读 · 0 评论 -
图像分割入门——FCN与U-Net
U-Net解决的是生物医学图像的分割问题。分割问题其实也是分类的一种,只不过是像素级别的分类。为了在同一图像中获得多维的概率,U-Net网络结构使用了全卷积的结构,网络中没有全连接层。对训练图像使用弹性形变进行数据增强。压缩路径中,每次池化之后会进行两次卷积。需要注意的是卷积后的通道数(滤波器个数)是池化之前的2倍。而在压缩路径中则相反,池化变为上采样,通道数变为减半的关系。压缩路径中...原创 2020-03-01 18:05:23 · 497 阅读 · 0 评论 -
dataframe常用操作总结
使用pandas读取csv文件iloc查看并且修改指定位置的数值但是不会改变原始的csv文件,重新读取,打印出来还是之前的数据可以先把之前的删除,再使用to_csv写入用来的路径保存时默认连同行列名也保存下来,可以使用header=False,index=False去除。如果连同行列名字保存下来,结果就是保存的csv文件会多出行列数。这时候再使用read_csv读取,并且heade...原创 2020-08-24 14:06:59 · 1180 阅读 · 0 评论 -
SVM原理与实战
opencv的安装路径,cpp-tutorial_code-ml中就有示例SVM是监督学习,所以要有训练数据与对应的标签。SVM参数svm_type=C_SVC由于opencv中的svm分类算法是根据libsvm改写而来的,libsvm是台湾一学者编写的matlab版本的svm算法,所以参数的设定的也大致相同。svm类型除了C_SVC之外,还有NU_SVC,ONE_CLASS,EP...原创 2021-01-18 20:35:13 · 485 阅读 · 0 评论 -
DL中常用的numpy
读txt文件按行读取有三种方式,注意readlines和readline的区别。open是python自带打开方式,如果打不开,可以使用encoding="UTF-8"指定解码方案。读取得到一行之后,行首行尾可能存在一些不需要的字符,就可以使用str.strip()去除,括号中是预期要去除的字符串。比如多行txt文件中会有换行符。strip一般与split搭配使用。split也可以指定...原创 2020-02-23 21:47:20 · 253 阅读 · 0 评论 -
Keras入门
首先当然是安装Keras。需要注意的是Keras有三种后端backend。后端是意思是Keras需要依赖他们进行张量的运算。这三种后端是:tensorflow,Theano,CNTK(微软)。这也是keras的优势:可以在多种生态中发布。一般使用Tensorflow作为后端,所以在安装Keras之前需要先安装tensorflow。在安装好Keras之后,命令行中import keras会提示usi...原创 2020-01-12 11:22:14 · 324 阅读 · 0 评论 -
YOLO9000
YOLO9000是YOLO的第三个版本。前两个版本是YOLO v1,YOLO v2,在CVPR2017的文章《Better,Faster,Stronger》中的前半部分都是对前两个版本的介绍,新的内容主要在Stronger部分。YOLO9000中的9000指的是YOLO可以对超过9000种图像进行分类。Better使用Batch normalization有利于收敛和正则化,甚至可以从网络...原创 2018-12-05 17:01:06 · 947 阅读 · 0 评论 -
windows+caffe下对CIFAR训练
CIFAR是什么CIFAR-10和CIFAR-100都是带标签的大小为8000万小图数据集的子集。其中CIFAR-10有10类,每类6000个大小为32x32的图像。其中训练图像和测试图像的比例是5:1,对每类图像,随机选择1000个测试图像,剩下的就是训练图像。注意到10类图像既有automobile,还有truck。它们是不重叠的。Automobile包含的是轿车,SUV等,truck只包含大...原创 2018-06-14 11:45:04 · 299 阅读 · 0 评论 -
大牛们的资料与主页
Mikolajczyk 特征检测主页http://lear.inrialpes.fr/people/mikolajczyk/SURF算法项目主页http://www.vision.ee.ethz.ch/~surf/南开大学媒体计算实验室 显著性检测https://mmcheng.net/zh/effisalobj/FT显著性算法https://ivrlwww.epfl.ch/suppl...原创 2019-04-12 17:04:40 · 340 阅读 · 0 评论 -
TensorFlow学习之——checkpoints
在看别人的训练网络中一开头就遇到这样一行代码:ckpt = tf.train.get_checkpoint_state(directories.checkpoints)鼠标放在函数名上,ctrl+B,或者ctrl+点击函数名,可以跳转到函数的定义,可以知道tf.train.get_checkpoint_state函数通过目录下的checkpoint文件找到checkpoint状态prot...原创 2019-02-25 22:47:38 · 7165 阅读 · 0 评论 -
李航《统计学习方法》---感知机
这一章就讲了感知机。我觉得是深受工业革命的影响,把一些可以实现功能的基本单元都喜欢叫做什么机,这里的感知机,还有后来的以感知机为基础的支持向量机。直接看定义,看本质,实际上,感知机是一种线性分类模型。下面就以这句话为中心仔细阐述一下。什么叫线性。线性liner,正如其名,两个变量的关系的函数是一条直线,那它们就是线性关系,扩展到三维,一个平面依然是一次方程,所以平面也行线性的。线性有两个性质:可加...原创 2018-06-28 17:31:16 · 518 阅读 · 0 评论 -
利用caffe的python接口实现DeepImageSynthesis实例
在之前实现faster rcnn的博客中,先是配置了caffe的python接口,但是在验证的时候用DeepTexture的实例没有成功。改用pycharm而不是jupyter notebook再试一试,毕竟在IDE中更好调试。新建工程,选择anaconda2作为解释器,因为要使用caffe作为模块,所以把编译好的x86/release下的caffe的python版本复制到lib/site-pac...原创 2018-06-27 16:21:19 · 425 阅读 · 0 评论 -
图像极坐标变换的研究
做图像配准的时候,发现图像进行旋转的情况下的配准有一些特殊。于是想到可以用极坐标进行配准。查了一下资料,发现大家用的更多的是对数极坐标Log Polar。笛卡尔坐标系和极坐标系先来说一下我们常用的笛卡尔坐标。X轴水平向右是正方向,y轴垂直于x轴,竖直向上是正方向。但是在计算机中图像的原点在左上方,所以如果是在笛卡尔坐标中进行旋转,需要三个矩阵相乘,分别实现从计算机坐标到笛卡尔坐标,旋转角度thet...原创 2018-07-02 17:27:17 · 15935 阅读 · 3 评论 -
以LeNet-5为例理解CNN
在用caffe实现对MNIST手写数字分类的过程中发现利用的网络是LetNet-5.决定从这个网络入手好好认识一下CNN。LeNet-5早在1998年就出现了(5表示5层模型),标志着CNN的诞生。以其作者YannLeCun的名字命名。但是却没有得到广泛的应用,原因一个是对机器要求高(当时没有GPU),一个是因为其他算法(SVM,老实说是你干的吧?)也能达到类似的效果甚至超过。之后的模型还有Ale...原创 2018-06-11 10:20:14 · 2012 阅读 · 0 评论 -
AI人工智能&ML机器学习&DL深度学习
人工智能Artificial Intelligence最早是在1956年提出的。几个计算机科学家在达特茅斯会议上希望能使计算机不仅仅是进行简单的计算,而是可以达到人脑相同的功能。关于人工智能,罗辑思维节目还做过一期节目,里面讲到人工智能一开始被嘲笑,它有多智能,就有多少人工,而且诡异的是,每当人工智能取得一些进步,我们就马上认为这是常规方法得到的结果,从而认定它不算是人工智能了。可见,人工智能还在...原创 2018-06-25 11:05:38 · 631 阅读 · 0 评论 -
windows下caffe+CPUOnly实现MNIST手写分类
工具下载微软官方移植的Caffe:https://github.com/Microsoft/caffe对属性表的操作需要把实例属性表的后缀改成vs可用的.props打开同一个文件夹下的Caffe.sln,查看其中的属性表<CpuOnlyBuild>true</CpuOnlyBuild> <UseCuDNN>false</UseCuDNN>...原创 2018-06-07 14:27:39 · 309 阅读 · 0 评论 -
三个数据集与deploy.prototxt
神经网络中经常会出现三种数据集:训练数据集train set、验证数据集validation set、测试数据集test set。对每个训练数据,计算得到准确性,在网络中后向传播误差,从而调整权重weights。对每一个验证数据,也会计算准确性accurary,当准确性达到阈值,就退出训练,这是为了防止过度拟合overfitting。70% should be train cases, 10% w...原创 2018-06-13 11:30:59 · 1186 阅读 · 0 评论 -
caffe下matlab、python的配置和faster RCNN的运行
因为自己的电脑没有安装linux环境,显卡也不支持CUDA,所以在实现faster RCNN的demo的过程中还是很麻烦的。完善项目文件下图是vs2013 打开的caffe解决方案的工程目录。由于windows版本caffe的不完善,要先在其libcaffe项目中添加roi_poling层的相关支持。(Fast R-CNN的ROIPooling层需要这个源文件编译)具体做法是对cu&inc...原创 2018-06-22 09:26:27 · 724 阅读 · 0 评论 -
Caffe中的卷积实现
https://www.zhihu.com/question/28385679https://github.com/Yangqing/caffe/wiki/Convolution-in-Caffe:-a-memo作者贾扬清亲自解释了这个问题。Caffe框架是他在研究生毕业毕业前两个月的时间写的,自然有一些缺点(占用内存方面)。其实卷积是很难优化的,因为我们一般是在单通道的图像和单个滤波器之间进行卷...原创 2018-06-12 11:02:19 · 1094 阅读 · 0 评论 -
OpenCV中的傅里叶的门道
接触到傅里叶-梅林算法,需要用到傅里叶变换,于是去查了一下OpenCV中的实现方法,没想到习以为常的傅里叶变换之中的门道还不少。//傅里叶变换https://blog.csdn.net/keith_bb/article/details/53389819 Mat I = imread("Lena.jpg", IMREAD_GRAYSCALE); //读入图像灰度图 //判断图像是否...原创 2018-07-11 21:18:13 · 1665 阅读 · 0 评论 -
李航《统计学习方法》-----朴素贝叶斯
朴素贝叶斯法naïve Bayes,在naïve的中间字母上其实有两个点,查了一下才发现是法语中的分音符,在发音过程中发挥作用。但这不是重要的,重要的是在这种学习方法中贝叶斯承担了什么样的角色。首先简单证明一下贝叶斯公式。联合概率Joint probabilities是可逆的,只要同时满足两个条件就可以,无所谓先满足哪个条件,所以可以有两种写法,都是利用了条件概率Conditionalpr...原创 2018-07-25 16:49:49 · 2236 阅读 · 0 评论 -
视频制作中的绿幕与拜耳阵列
先来欣赏一些大片背后的特效。现在国内的电影市场越来越大,做短视频的自媒体也越来越多,在他们的后期视频制作的片花中可以看到很多都在使用绿幕或者蓝幕,这是为什么呢?首先肯定是为了抠图的方便。将主体部分抠出再将通过特效渲染的背景图像叠加上去。那么为什么使用的幕布颜色是绿色或者蓝色呢?我们知道光源的三原色是RGBRBG,而抠像的主体一般是人,红色接近人类肤色,在密布红色的工作环境中,长时间的工作也...原创 2019-01-02 16:34:31 · 2577 阅读 · 0 评论 -
Deep Image Homography Estimation
在知乎问题:深度学习应用在哪些领域让你觉得「我去,这也能行!」?中遇到一篇提交在arXiv 2016(arXiv不是正式发表,只是可以证明原创性,提供时间戳的网站)的文章《Deep Image Homography Estimation》,感觉对自己帮助很大,所以记录在这里。之前自己也在思考如何利用神经网络实现图像的配准,没思考出什么结果来。大部分的深度学习中使用的是单幅图像进行训练,如果输入...原创 2018-12-25 20:58:37 · 7360 阅读 · 10 评论 -
利用ORB/AKAZE特征点进行图像配准
Kp1,kp2都是list类型,两幅图都是500个特征点。这和ORB论文中的数据是一样的。4.4章节Matches也是list类型,找到325个匹配对。AKAZE文章中提到一个指标:MS(matching score)=# Correct Matches/# Features,如果overlap area error 小于40%并且经矩阵变换后两个对应像素距离小于2.5个像素,就说...原创 2018-12-10 11:22:06 · 5762 阅读 · 0 评论 -
什么是单应矩阵和本质矩阵
知乎上面的大牛还是很多,直接搜Homography或者单应矩阵就能得到很多大神的回答,可能回答中的一句话或者一个链接就够自己学习很久。其实在之前研究双目视觉的时候就接触了对极几何,通过视觉就可以得到物体的远近信息,这也是特斯拉等自动驾驶甚至可以完全使用摄像头而不使用雷达的原因。通过下面这幅图说明一下匹配点必须在极线上。在单镜头下,同一个径向的物体P、Q的成像是重合的,所以我们无法判断物...原创 2018-12-20 15:52:59 · 3748 阅读 · 0 评论 -
什么是图像变换
还是看OpenCV官方手册,我觉得这样可以同时学习如何使用函数和如何理解一些基本概念。首先,这里的几何变换geometrical transformations是针对2D图像而言的,不改变图像内容而是将像素网格变形deform the pixel grid,映射到目标图像destination image。目标图像不是由源图像直接得到,因为数字图像是离散的,所以源图像的像素点的映射无法保证落在...原创 2018-12-20 11:40:49 · 2266 阅读 · 0 评论 -
A-KAZE论文研读
AKAZE是KAZE的加速版本。KAZE在构建非线性空间的过程中很耗时,在AKAZE中将Fast Explicit Diffusion(FED)加入到金字塔框架可以dramatically speed-up。在描述子方面,AKAZE使用了更高效的Modified Local Difference Binary(M-LDB),可以从非线性空间中利用梯度信息gradient information。M...原创 2018-11-27 17:22:55 · 10173 阅读 · 4 评论