![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
图形图像
NeverMore_7
野鸡大学CS学生
展开
-
非极大值抑制(Non-maximum suppression, NMS)
初次接触到非极大值抑制算法(Non-maximum suppression, NMS)是在CNN学习过程中,当时看到R-CNN SP-NET中都用到了该方法作为最后确定目标bounding box 。常常经过图像定位算法或者深度网络学习得出的bounding box不止一个,各个box会出现重叠交叉,如图1。 为了精确的定位到目标的在图像的位置,常常有三种方法:原创 2017-07-18 10:17:45 · 3365 阅读 · 1 评论 -
最短路径算法(Dijkstra、Floyd)总结
引言最短路径算法是图算法中比较重要的组成部分,在《算法导论》中有比较详细的阐述和证明。很长时间没在看过图算法的内容,在接触到增强学习后,复习了下A*算法,故对最短路径算法进行一下简单的总结,A*算法将会另外开一篇文章。Dijkstra和Floyd算法是最为经典的两个针对无向图进行最短路径求取的算法,本文先对这两个算法进行回顾和总结。Dijkstra算法Dijkstra算法在解决最短路径算法时有一定的原创 2017-10-04 16:28:16 · 3472 阅读 · 1 评论 -
模糊集在图像二值化与图像增强的运用
引言模糊理论说得直白一点就是表达不确定性,这个不确定性是用一个隶属度函数来衡量,该函数的取值为[0,1][0,1],隶属度函数值越大则趋于一致,当隶属度函数值为00时,表示相反。关于模糊理论的一般定义和表述可以参考Gonzalez《数字图像处理》。本文关注的是模糊集在数字图像处理的运用,包括图像二值化和图像增强两方面的运用,主要内容来自以下两篇论文:[1]. Image thresholding原创 2017-09-22 15:28:09 · 2844 阅读 · 1 评论 -
opencv读取图像数据的方式总结
引言opencv是计算机视觉中使用最广泛同时也是功能最全的一个开源库,为图像处理以及计算机视觉工作者提供了极大的方便,本文就opencv读取图像数据文件做一个总结,高年级同学以及大牛请无视。opencv中图像的结构图像的结构可以看作是一个2维矩阵,opencv在对图像的结构定义中也采用了这一方式。在总结之前,有必要对opencv中图像结构定义的一些成员变量意义进行说明,更详细的请参考opencv官方原创 2017-10-08 14:06:26 · 10087 阅读 · 1 评论 -
软权值共享
前言权值共享是一种减小深度网络中参数数量的方法,常见于卷积神经网络(CNN)。在CNN中每一个特征图是一组相同的参数对图像进行卷积中,每一组参数对应着图像每个局部的特征。这样的的权值共享叫做硬权值共享。而某些场景下,我们并不能这样使用同一组参数作,而使用相似的参数,这叫做软权值共享。软权值共享以一种正则化的形式给出。软权值共享我们常见的正则化形式是λwwT\lambda ww^T,如果将权值看作是符原创 2017-09-08 18:19:33 · 2185 阅读 · 0 评论 -
集成学习之Adaboost
写在前面在前面的文章集成学习中对集成学习的大致思想进行了概括性的说明,根据模型之间是否存在依赖可将集成学习分为串行和并行两种,前者依赖于上一次模型的预测结果,后者模型之间并不相互依赖,Adaboost是boosting的最为人所知的模型,既可以用作回归任务,也可用于分类任务。Adaboost框架原理前面的文章中,已经对boosting框架的原理进行了说明,这里我们不厌其烦的再次给出boosting的原创 2017-09-05 03:32:38 · 1348 阅读 · 0 评论 -
图像检索系统《Deep Learning of Binary Hash Codes for Fast Image Retrieval》
引言总结2015年CVPR论文《Deep Learning of Binary Hash Codes for Fast Image Retrieval》,论文主要内容是利用卷积神经网络(CNN)来构建图像相似度检测的深度学习方法。主要思想是讲卷积神经网络来提取图像特征,并将特征转化为二值量,根据二值向量来计算图像的相似度。传统方法图像检索的基础便是提取图像的特征信息,提取的特征信息越丰富,在进行检索原创 2017-08-04 10:56:35 · 1298 阅读 · 0 评论 -
局部敏感哈希 LSH
引言局部敏感哈希(Locality-Sensitive Hashing, LSH)是用来解决高维检索问题的算法。想象一下,现在有数量庞大的数据点,每个点的维度可能几千或几万,给定一个点p,在这数据点集中寻找到可p最近的点或者最近的k个点。思路很清晰,我们必须要计算p到每个点的距离,根据计算结果排序,选择最近的点或者前k个点,距离可以用L1或L2泛数计算。这样的线性搜索,时间复杂度极高,效率地下。LS原创 2017-08-03 17:30:42 · 2393 阅读 · 0 评论 -
RNN结构及反BPTT向传播算法
写在前面传统的人工神经网络(Artificial Neural Network,ANN)存在很多局限性,在不断发展中,出现了真对图像数据的卷积神经网络(Convolutional Neural Network,CNN),解决了图像数据大,权重参数过多难以训练的问题。以及针对有序序列数据的循环神经网络(Recurrent neural Network,RNN),不谋而合的是在这两种网络中都采用了权重共原创 2017-08-16 14:17:04 · 687 阅读 · 0 评论 -
从傅里叶级数到傅里叶变换
写在前面傅里叶变换这个东东是一块心病,记得刚接触计算机视觉那会儿,最先看的是冈萨雷斯的《数字图像处理》。当看到频率域滤波那章节的时候,首先就是傅里叶变换,当时看了两三遍愣是没懂。无奈之下,去问老师,而后被一句话“你只需要知道怎么用,现在不需要知道原理”打发了,好吧!我确实也放弃没在去纠结原理啥的,只知道怎么用code变换,然后进行滤波。后来某段时间又想起来,所以又去看了看,直到今天也不敢说是真正理解原创 2017-10-12 16:01:03 · 4574 阅读 · 0 评论