![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
读书笔记
文章平均质量分 90
zcg1942
这个作者很懒,什么都没留下…
展开
-
torch相比于numpy都干了什么——torch入门
https://pytorch.apachecn.org/docs/1.4/blitz/tensor_tutorial.html原创 2023-02-15 18:56:08 · 776 阅读 · 0 评论 -
XGBoost的安装与介绍
Reference:1.字节跳动架构师https://zhuanlan.zhihu.com/p/303398072.浅谈https://www.jianshu.com/p/d55f7aaac4a7原创 2021-02-26 22:17:28 · 912 阅读 · 0 评论 -
KAZE论文研读
KAZE是发表在ECCV2012的一种特征点检测算法,相比于SIFT和SURF,KAZE建立的高斯金字塔是非线性的尺度空间,采用加性算子分裂算法(Additive Operator Splitting, AOS)来进行非线性扩散滤波。一个很显著的特点是在模糊图像的同时还能保留边缘细节。邹宇华在CSDN中有一系列文章进行了讲解。AKAZE 是加速版KAZE特征,即Accelerated KAZE...翻译 2018-11-14 16:20:18 · 5817 阅读 · 1 评论 -
ORB论文研读与代码实现
首先,ORB算法来自于OpenCV Labs,相比于SIFT和SURF,ORB在使用中不必担心专利的问题。但同时ORB在保证了一定性能的条件下做到了高效。在论文《ORB: An efficient alternative to SIFT or SURF》2011中,ORB在特征点检测和描述子生成方面都做了改进,结果是ORB is at two orders of magnitude fast...原创 2018-11-07 15:08:15 · 3829 阅读 · 0 评论 -
双摄与双目视觉
越来越多的手机开始上双摄,首先解释一下双摄的目的,双摄可以达到什么样的效果。首先双摄可以分为两类,一类是利用双摄获得图像中物体到镜头或者焦距的距离,得到景深信息就可以进行后续的3D重建、图像分割、背景虚化等;一类是利用两个摄像头所成的不同图像进行图像融合,获得更多的细节信息,包括RGB镜头和Mono黑白摄像头获得图像的融合,黑白摄像头可以捕捉更多的细节,即解析力更高;还有广角摄像头和长焦摄像...原创 2018-10-22 16:31:26 · 2944 阅读 · 0 评论 -
神经网络相关的笔试题目集合(一)
在找工作的过程中发现好多公司没有专门的、传统的图像处理岗位,所以只能参加算法类的笔试甚至AI类的笔试。在AI的笔试中几乎全是关于神经网络的问题,其实也都是很基础的一些问题,如果事先做了准备,可以从容应对。而对于我这种从传统图像处理算法向深度学习靠拢的新手,不失为一种很好的入门方法。既然是考察神经网络,激活函数activation function作为模拟人脑中神经元之间的激活/抑制的关键,经常...原创 2018-10-15 20:23:43 · 5499 阅读 · 0 评论 -
链表中的指针
中期答辩改在了国庆之后,终于有时间可以看看剑指offer了。在看到单向链表的部分,对指针,尤其是头指针有点疑惑。首先容易理解的是链表的节点是一个结构体,该结构体包含一个数据(一般是int型),还包含一个指向该结构体类型的指针。通过指针的指向一个个遍历,也是通过指针一次次分配内存。这使得链表不同于数组,链表中的内存不是连续的,我们想要访问一个结点只能从头结点开始。其实数组之所以能通过数组下标进行访问...原创 2018-09-26 18:48:20 · 11423 阅读 · 0 评论 -
comparing ORB and AKAZE
文章全称是《Comparing ORB and AKAZE for visual odometry of unmanned aerial vehicles》。这是一篇来自巴西的文章,没有在百度文库中找到,是在其他博客中给出的链接得到的。从链接的URL可以看出这是一篇来自会议CCIS云计算与智能系统国际会议的文章。文章将特征点检测和匹配的方法应用在了无人控制飞行器Unmanned Aerial ...翻译 2018-11-23 10:06:59 · 1119 阅读 · 1 评论 -
A-KAZE论文研读
AKAZE是KAZE的加速版本。KAZE在构建非线性空间的过程中很耗时,在AKAZE中将Fast Explicit Diffusion(FED)加入到金字塔框架可以dramatically speed-up。在描述子方面,AKAZE使用了更高效的Modified Local Difference Binary(M-LDB),可以从非线性空间中利用梯度信息gradient information。M...原创 2018-11-27 17:22:55 · 10173 阅读 · 4 评论 -
YOLO9000
YOLO9000是YOLO的第三个版本。前两个版本是YOLO v1,YOLO v2,在CVPR2017的文章《Better,Faster,Stronger》中的前半部分都是对前两个版本的介绍,新的内容主要在Stronger部分。YOLO9000中的9000指的是YOLO可以对超过9000种图像进行分类。Better使用Batch normalization有利于收敛和正则化,甚至可以从网络...原创 2018-12-05 17:01:06 · 947 阅读 · 0 评论 -
什么是图像
图像,尤其是数字图像的定义,在冈萨雷斯的书中是一个二维函数f(x,y),x,y是空间平面坐标,幅值f是图像在该点处的灰度或者强度。下面通过OpenCV中最常用的图像表示方法Mat来看一下在计算机中是怎么定义图像的。Mat的定义OpenCV在2.0之后改用C++实现了Mat类,从而代替了IplImage,不用再手动分配和释放内存。Mat其实是原来存放数组的,数组可以是单通道的也可以是多通道的...原创 2018-12-14 11:45:59 · 6127 阅读 · 0 评论 -
Deep Image Homography Estimation
在知乎问题:深度学习应用在哪些领域让你觉得「我去,这也能行!」?中遇到一篇提交在arXiv 2016(arXiv不是正式发表,只是可以证明原创性,提供时间戳的网站)的文章《Deep Image Homography Estimation》,感觉对自己帮助很大,所以记录在这里。之前自己也在思考如何利用神经网络实现图像的配准,没思考出什么结果来。大部分的深度学习中使用的是单幅图像进行训练,如果输入...原创 2018-12-25 20:58:37 · 7360 阅读 · 10 评论 -
电影、电视和游戏中的帧率
之前在即刻上看到一个搬运自极客湾的视频,知乎上也有更详尽的文字解释https://www.zhihu.com/question/21081976/answer/34748080。我这里再简单总结一下。众所周知,电影一般是24帧的,有一个电影的公众号就叫24帧。首先我们来看为什么大多数电影都是24帧,然后再比较一下电影中的帧数和游戏中的帧有什么区别,为什么游戏中需要更高的帧数会流畅。通常的解...原创 2019-02-17 12:15:02 · 10846 阅读 · 0 评论 -
TensorFlow学习之——checkpoints
在看别人的训练网络中一开头就遇到这样一行代码:ckpt = tf.train.get_checkpoint_state(directories.checkpoints)鼠标放在函数名上,ctrl+B,或者ctrl+点击函数名,可以跳转到函数的定义,可以知道tf.train.get_checkpoint_state函数通过目录下的checkpoint文件找到checkpoint状态prot...原创 2019-02-25 22:47:38 · 7165 阅读 · 0 评论 -
大牛们的资料与主页
Mikolajczyk 特征检测主页http://lear.inrialpes.fr/people/mikolajczyk/SURF算法项目主页http://www.vision.ee.ethz.ch/~surf/南开大学媒体计算实验室 显著性检测https://mmcheng.net/zh/effisalobj/FT显著性算法https://ivrlwww.epfl.ch/suppl...原创 2019-04-12 17:04:40 · 340 阅读 · 0 评论 -
图像复原和维纳滤波
之前上课的时候其实就没搞懂什么是维纳滤波和卡尔曼滤波,老师完全讲不清楚来龙去脉,滤波、预测都说不清楚。后来刷知乎看到大神的解释,当时倒是茅塞顿开,但是前几天做笔试遇到关于维纳滤波的题目,发现功课没做够。要学习一个东西,我认为第一步不应该是讲它的定义,而是先搞清楚它是在上面背景下提出的,伟大的数学家提出一个概念肯定不是为了考我们的,而是为了解决实际问题的。冈萨雷斯书中第三章和第四章分别讲了空间滤...原创 2018-09-06 16:42:50 · 15549 阅读 · 3 评论 -
冈萨雷斯《数字图像处理》读书笔记(三)——空间滤波
滤波这个词来源于频域处理,因为它的目的就是针对频率分量而言的,滤除一定的频率分量。但其实滤波在时域(图像中对应为空域)中也可以完成相应的操作,比如低通滤波器滤除了代表细节的高频分量,我们可以直接在图像空域通过高斯卷积达到类似平滑的效果。事实上,线性空间滤波与频率域滤波之间存在一一对应的关系,注意这里说的是线性空间,也就意味着空域滤波相比于频率域滤波,还可以实现非线性滤波。图像空间域上的处理一般...原创 2018-08-31 14:19:07 · 1380 阅读 · 0 评论 -
吴恩达斯坦福大学机器学习 CS229 课程学习笔记(一)
说到机器学习总绕不过几个鼎鼎大名的人物,他们都创造了不少的机器学习资料,斯坦福吴恩达Andrew Ng的公开课CS229;Google李飞飞的CS231、周志华的、李航的《统计学习方法》、林轩田的《机器学习基石》、Peter Harringtond 的《机器学习实战》、周志华的《机器学习》(西瓜书,书中都是拿西瓜举例子)。CS229的官方网站是http://cs229.stanford.edu/,...原创 2018-04-09 21:16:54 · 7640 阅读 · 1 评论 -
图像处理中的通信原理——冈萨雷斯读书笔记(一)
信息的概念在信息论中很明确:用于衡量事件的不确定性。信息的传播形式或者所载体便是信号,比如说电信号、光信号、声音信号。那么信息的表现形式就是消息,可以是语言、文字、图像。所以说图像处理依然是信息与通信领域的一部分。它可以看作是编码后的信息,即信源的编码。本文就将着重记录图像处理的一些通信专业知识。首先就图像的成像来说,最重要的图像能源是电磁能谱(其他主要图像能源包括声波、超声波、电子(用于电子显微...原创 2018-04-02 15:46:18 · 1438 阅读 · 0 评论 -
吴恩达斯坦福大学机器学习 CS229 课程学习笔记(二)
终于要开始正式的学习了。看了第一节课最大的印象是Ng老师的优雅,儒雅,偏英式的发音(突然意识到他从小在伦敦长大)。配着字幕看的视频,但还是希望能锻炼一下自己的听力,也只有在自己看过一遍印象才深刻,别人的读书笔记再好那也是二手资料。公共课是300人的大课程,感觉和国内的上课氛围也差不多,也是三人一个小组完成project,只不过Ng最后给了一些自己学生的作品确实很具有吸引力。恭维一个西电的图像说斯坦...原创 2018-04-10 14:13:39 · 1012 阅读 · 0 评论 -
图像处理中的通信原理——冈萨雷斯读书笔记(二)
参考伯乐在线的一篇文章,做图像的傅里叶变换。在PyCharm中安装cv2时出错,如下图:根据提示建议在命令行中执行命令pip install cv2也依然是No matching distribution found for cv2.注意到pip可以更新,但这不是问题所在。然而,将相同的py文件添加在venv文件夹中没有在import时报错。venv是virtual environment的缩写。...原创 2018-04-03 10:13:26 · 654 阅读 · 0 评论 -
图像处理中的通信原理——冈萨雷斯读书笔记(三)
法国数学家傅里叶男爵在1822年出版的《热分析理论》一书中指出,任何周期函数都可以表示为不同频率的正弦和或余弦和(每个正弦项/余弦项乘不同的系数)的形式,这其实就是无穷级数的一种:傅里叶级数。无穷级数的思想是通过简单的函数形式,逼近复杂的函数,包括泰勒级数、幂级数也是这个道理。还是回到傅里叶级数,我们可以坐而论道地简单地想一下为什么所有符合要求的周期函数都可以表示为余弦/正弦之和。我们可以把函数看...原创 2018-04-05 20:56:08 · 756 阅读 · 0 评论 -
windows下caffe+CPUOnly实现MNIST手写分类
工具下载微软官方移植的Caffe:https://github.com/Microsoft/caffe对属性表的操作需要把实例属性表的后缀改成vs可用的.props打开同一个文件夹下的Caffe.sln,查看其中的属性表<CpuOnlyBuild>true</CpuOnlyBuild> <UseCuDNN>false</UseCuDNN>...原创 2018-06-07 14:27:39 · 309 阅读 · 0 评论 -
李航《统计学习方法》笔记
虽然书名是统计学习,但是却是机器学习领域中和重要的一本参考书。当前的机器学习中机器指计算机,但是所运用的方法和知识是基于数据(对象)的统计和概率知识,建立一个模型,从而对未来的数据进行预测和分析(目的)。第一段提到的模型是很重要的,事实上,模型(model)是统计学习方法的三要素之一,其他另外两个策略strategy和算法algorithm也是围绕模型的,简单来说,策略决定了使用什么样的损失函数(...原创 2018-06-25 16:25:00 · 1330 阅读 · 0 评论 -
以LeNet-5为例理解CNN
在用caffe实现对MNIST手写数字分类的过程中发现利用的网络是LetNet-5.决定从这个网络入手好好认识一下CNN。LeNet-5早在1998年就出现了(5表示5层模型),标志着CNN的诞生。以其作者YannLeCun的名字命名。但是却没有得到广泛的应用,原因一个是对机器要求高(当时没有GPU),一个是因为其他算法(SVM,老实说是你干的吧?)也能达到类似的效果甚至超过。之后的模型还有Ale...原创 2018-06-11 10:20:14 · 2012 阅读 · 0 评论 -
李航《统计学习方法》-----支持向量机
书中第七章才是支持向量机SVM,但在SVM与感知机有相似的地方,看了感知机的知识之后趁热先看看SVM。首先回顾一下感知机。感知机的模型是线性分类模型,将两种类别标记为正负1,将新的样本输入线性函数,再将线性函数代入符号函数就可以得到输出作为判定结果。这里最重要的还是线性函数的选取,线性函数在特征空间中可能就是一个超平面,只要这个超平面能将正负样本完全分隔开来就是符合要求的超平面,这也就是感知机的策...原创 2018-07-09 20:23:22 · 1584 阅读 · 0 评论 -
李航《统计学习方法》---感知机
这一章就讲了感知机。我觉得是深受工业革命的影响,把一些可以实现功能的基本单元都喜欢叫做什么机,这里的感知机,还有后来的以感知机为基础的支持向量机。直接看定义,看本质,实际上,感知机是一种线性分类模型。下面就以这句话为中心仔细阐述一下。什么叫线性。线性liner,正如其名,两个变量的关系的函数是一条直线,那它们就是线性关系,扩展到三维,一个平面依然是一次方程,所以平面也行线性的。线性有两个性质:可加...原创 2018-06-28 17:31:16 · 518 阅读 · 0 评论 -
李航《统计学习方法》-----朴素贝叶斯
朴素贝叶斯法naïve Bayes,在naïve的中间字母上其实有两个点,查了一下才发现是法语中的分音符,在发音过程中发挥作用。但这不是重要的,重要的是在这种学习方法中贝叶斯承担了什么样的角色。首先简单证明一下贝叶斯公式。联合概率Joint probabilities是可逆的,只要同时满足两个条件就可以,无所谓先满足哪个条件,所以可以有两种写法,都是利用了条件概率Conditionalpr...原创 2018-07-25 16:49:49 · 2236 阅读 · 0 评论 -
Rand函数使用和对补码的理解
下面是在牛客网看到的一道题;//假设这n个数的序号依次为0,1,2,...,n-1,数组名为numvoid knuth1(int* pNum, int m, int n){ srand((unsigned int)time(0)); for (int i=0; i<n; i++) { if (rand()%(n-i) < m...原创 2018-07-26 21:54:35 · 424 阅读 · 0 评论 -
冈萨雷斯《数字图像处理》读书笔记(十一)——表示和描述
虽然不是专门研究图像分割的(峰兄才是),但多少接触了一点,并且图像分割是图像处理中的最为复杂的,通过图像分割可以很好地认识图像处理的好多方法。今天看的是边界追踪和链码的表示。网易计算机视觉工程师的第一道选择题就考察了这个,其实冈萨雷斯的书第11章就有讲,还是要多看书啊。书中是接着图像分割讲的。我们分割完成后总要表示它,那么就有两种思路,一种是选择外部特征,表示分割部分的边界,一种是选择内部特征...原创 2018-08-17 09:15:30 · 3119 阅读 · 0 评论 -
冈萨雷斯《数字图像处理》读书笔记(九)——形态学图像处理
形态学来自于生物学,研究动植物的形态和结构。运用在图像中可提取如边界、骨架和凸壳。初学形态学都是在二值化的图像上研究,之后可以扩展到灰度图像。膨胀和腐蚀数学形态学与集合论分不开,因为形态学中的操作是基于两个集合的,一个是待处理的像素集合,一个我们叫做结构元SE。SE的形状有多种,原点也有多种,但一般是重心,原点在腐蚀erode和膨胀dilate中表示当前要处理的像素点。像卷积一样,结构元会...原创 2018-08-20 17:30:02 · 1029 阅读 · 3 评论 -
图像处理中的通信原理——冈萨雷斯读书笔记(四)
完美重建要求使用无限求和来内插,实践中,不得不寻求某种近似。在图像处理中,二维内插最普通的应用就是调整图像的大小。放大可看成是过取样,缩小是欠取样。无论是过取样还是欠取样,都需要内插,内插有最近邻、双线性、双三次。在图像配准构建图像金字塔的过程中,和图像配准的最后一步图像透视变换,都需要内插,内插的好坏直接影响最终的效果。当我们想要整数倍得地增加一幅图像的尺寸时,与过取样相联系的最近邻内插的一个特...原创 2018-04-09 10:13:20 · 874 阅读 · 0 评论