图像检索
文章平均质量分 84
wishchin
CV算法工程师:从事室内场景感知方面工作,完成算法实验和软件开发。
展开
-
关于XML学习
XML为知识构架存储语言:http://www.w3school.com.cn/xml/xml_tree.asp原创 2013-10-20 14:36:05 · 674 阅读 · 0 评论 -
信息检索及DM必备知识总结:luncene
信息检索和网络数据领域(WWW, SIGIR, CIKM, WSDM, ACL, EMNLP等)的论文中常用的模型和技术总结(为什么概率是可靠的,概率隐藏了大部分事实,而给予我们可以看得见的部分.)转载 2014-01-23 14:10:55 · 886 阅读 · 0 评论 -
推荐系统的十个关键点
亚马逊的CEO Jeff Bezos曾经说过,他的梦想是“如果我有100万个用户,我就要为他们做100万个亚马逊网站”。智能推荐系统承载的就是这个梦想,即通过数据挖掘技术,为每一个用户实现个性化的推荐结果,让每个用户更便捷的获取信息.转载 2014-02-13 16:06:43 · 2135 阅读 · 0 评论 -
open source project for recommendation system
目前互联网上所能找到的知名开源推荐系统(open source project for recommendation system),并附上了个人的一些简单点评(未必全面准确):SVDFeature,上大C++语言;Crab是基于Python;CofiRank,C++开发;EasyRec=Java开发;Graphlab基于C++分布graph;Mahout知名度很高.................转载 2014-02-13 16:13:55 · 1382 阅读 · 0 评论 -
混合推荐系统 类型
混合推荐系统是推荐系统的另一个研究热点,它是指将多种推荐技术进行混合相互弥补缺点,从而可以获得更好的推荐效果。最常见的是将协同过滤技术和其他技术相结合,克服cold start的问题。(1)加权型(2)转换型(3)合并型(4)特征组合(5)瀑布型(6)特征递增型(7)元层次型转载 2014-02-13 16:15:04 · 2255 阅读 · 0 评论 -
基于物品的协同过滤ItemCF的mapreduce实现
基于物品的协同过滤ItemCF数据集字段:1. User_id: 用户ID2. Item_id: 物品ID3. preference:用户对该物品的评分算法的思想:1. 建立物品的同现矩阵A,即统计两两物品同时出现的次数转载 2014-12-28 18:10:46 · 1568 阅读 · 1 评论 -
搜索引擎的查询意图识别(关联分析)
通用搜索VS垂直搜索: 通用搜索特点: 抓取互联网上一切有价值的页面,同意建立索引,以关键字匹配为基本检索方式,以网页title和summary为展现方式 google, 百度,搜狗,搜搜,有道 垂直搜索特点: 以一特定类别为主题,只抓取与主题相关信息,根据主题特点有针对性的建立相应的索引检索方式,筛选方式,以及展现方式 机票搜索,地图搜索,购物搜索转载 2015-04-11 21:31:19 · 4210 阅读 · 0 评论 -
CNN结构:用于检测的CNN结构进化-一站式方法
人眼能够快速的检测和识别视野内的物体,基于Maar的视觉理论,视觉先识别出局部显著性的区块比如边缘和角点,然后综合这些信息完成整体描述,人眼逆向工程最相像的是DPM模型。 YOLO的特别之处,在于把检测问题表示为一个分类问题,而不是以往的寻找绑定框/包围盒+分类的问题。使用一个网络实现检测的功能,成为一个端到端的图像检测系统。转载 2017-08-19 23:02:08 · 2099 阅读 · 2 评论 -
在线场景感知:图像稀疏表示-ScSPM和LLC总结(lasso族、岭回归)
前言 场景感知应用于三维场景和二维场景,可以使用通用的方法,不同之处在于数据的形式,以及导致前期特征提取及后期在线场景分割过程。场景感知即是场景语义分析问题,即分析场景中物体的特征组合与相应场景的关系,可以理解为一个通常的模式识别问题。论文系列对稀疏编码介绍比较详细...本文经过少量修改和注释,如有不适,请移步原文。 code下载:http://www.ifp....转载 2013-10-08 21:49:55 · 3405 阅读 · 0 评论 -
Haar、pico、npd、dlib等多种人脸检测特征及算法结果比较
Pico(Pixel Intensity Comparison-based Object detection)发表于2014年,不同于VJ的Haar特征,pico则是提取点对特征,对两个像素点进行对比。实验表明这种特征比Haar特征更为有效,且运算时间更短。但是点对提取意味着PICO的抗噪性能极差,场景可扩展性不强。另外通过NDP特征池是可以重建出原图的,也就是说特征池包含了原图片中的所有信息转载 2017-05-04 11:44:33 · 5551 阅读 · 1 评论 -
综述:基于内容的三维形状检索
第二章给出3D形状表示技术的综述。第三章介绍形状相似度和匹配的概念。第四章介绍相似度匹配和模型检索中的3D形状描述方法。第五章介绍3D形状搜索引擎的整体结构及各部分子系统。第六章给出3D形状检索系统的评价和性能描述。转载 2014-04-17 19:07:09 · 7755 阅读 · 0 评论 -
图像局部显著性—点特征(SIFT为例)
基于古老的Marr视觉理论,视觉识别和场景重建的基础即第一阶段为局部显著性探测。探测到的主要特征为直觉上可刺激底层视觉的局部显著性——特征点、特征线、特征块。 SalientDetection已经好就没有复习过了,DNN在识别领域的超常表现在各个公司得到快速应用,在ML上耗了太多时间,求职时被CV的知识点虐死...点探测总结(SIft、PCA-SIft、Su...原创 2015-04-20 11:32:33 · 14632 阅读 · 2 评论 -
CNN结构:用于检测的CNN结构进化-分离式方法
基于CNN的目标检测框架主要有两种:一种是 one-stage ,例如 YOLO、SSD 等,这一类方法速度很快,但识别精度没有 two-stage 的高,其中一个很重要的原因是,利用一个分类器很难既把负样本抑制掉,又把目标分类好。 另外一种目标检测框架是 two-stage ,以 Faster RCNN 为代表,这一类方法识别准确度和定位精度都很高,但存在着计算效率低,资源占用大的问题。转载 2017-08-15 10:27:38 · 2051 阅读 · 0 评论 -
Caffe RPN:把RPN网络layer添加到caffe基础结构中
在测试MIT Scene Parsing Benchmark (SceneParse150)使用FCN网络时候,遇到Caffe错误。 遇到错误:不可识别的网络层crop 网络层 CreatorRegistry& registry = Registry(); CHECK_EQ(registry.count(type), 1) &...原创 2018-03-14 09:56:25 · 443 阅读 · 0 评论 -
三维重建PCL:点云单侧面正射投影
终于把点云单侧面投影正射投影的代码写完了,为一个阶段,主要使用平面插值方法,且只以XOY平面作为的正射投影面。有些凑合的地方,待改进。 方法思路:使用Mesh模型,对每一个表面进行表面重建。借助OpenCV Mat类型对投影平面进行内点判断,对内点位置进行插值。 OpenCV cv::polylines 和lines 进行画图的时候都会出现问题,...原创 2018-03-22 15:02:03 · 5041 阅读 · 10 评论 -
语义分割:使用关系图辅助图像分割-Capsule Network、IceNet
文章:欲取代CNN的Capsule Network究竟是什么来头?它能为AI界带来革命性转折么?转载 2018-06-06 16:48:35 · 1935 阅读 · 0 评论 -
图像压缩Vs.压缩感知
SparseCoding,压缩感知。对样本集合进行超完备重建,使用非监督学习方法,寻找样本特征集的超完备基,而对任一样本来说,使用此组基的表示稀疏是稀疏的,即只有少量的基向量非0。小品文压缩感知科普文两则:原文链接:http://www.cvchina.info/2010/06/08/compressed-sensing-2/ 这几天由于happyharry...转载 2013-09-23 09:50:13 · 4958 阅读 · 0 评论 -
Metric Learning度量学习:**矩阵学习和图学习
ML的两条主要路线,从样本中学习一个度量,或者使用样本训练一个网络。一篇metric learning(DML)的综述文章,对DML的意义、方法论和经典论文做一个介绍,同时对我的研究经历和思考做一个总结。可惜一直没有把握自己能够写好,因此拖到现在。先;列举一些DML的参考资源,以后有时间再详细谈谈。转载 2016-05-18 19:23:38 · 5743 阅读 · 0 评论 -
ML大杂烩:**常见机器学习算法公式梳理
找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个。本文写出常见데机器学习데公式表示:1.朴素贝叶斯;2. 决策树;3.Logisitic回归;4. 线性回归 ; 5.KNN算法 ;6. SVM算法; 7.Boosting算法; 8. 聚类公式; 9. 10. pLSA 浅语义分析-SVD分解; 11.LDA-隐式狄利克雷; 12. GBDT ;13. 正则化; 14.离群点检测; 15.EM算法 ; 16. Apriori关联分析; 17.F转载 2014-12-05 16:31:50 · 7179 阅读 · 0 评论 -
C++版的LLC代码
图像稀疏编码总结:LLC和SCSPM ,文章对稀疏编码讲解非常详细。《Locality-constrained Linear Coding for Image Classification》的作者提供Matlab的代码实现,见http://www.ifp.illinois.edu/~jyang29/LLC.htm。下面是根据作者的代码,基于OpenCV,实现的C++版的LLC:Matl...转载 2016-05-18 19:16:44 · 1484 阅读 · 0 评论 -
CaptCha的现状与未来
“验证码”( CAPTCHA )其实并不是各位网友总是在不同网站上看到的难以辨认的字母组合的代名词,而是“全自动区分计算机和人类的图灵测试”的俗称,顾名思义,它的作用是区分计算机和人类。转载 2014-11-13 10:40:16 · 1501 阅读 · 0 评论 -
BOW模型在ANN框架下的解释
Bag of words模型(简称BOW)是最常用的特征描述的方法了。在图像分类和检索的相关问题中,能够将一系列数目不定的局部特征聚合为一个固定长度的特征矢量,从而使不同图像之间能够进行直接比较。BOW的改进方法包括一些稀疏的编码方式(如llc),kernel codebooks等,使得BOW一般作为benchmark被比较。然而,BOW往往作为一种编码方式被解释着(SIFT作为coding,BOW作为average pooling),在这里,我会从一个近似最近邻(approximate nearest n转载 2014-06-30 14:15:24 · 831 阅读 · 0 评论 -
图像检索中为什么仍用BOW和LSH
BOW在检索时好于LSH,那么为什么不在任何时候都用BOW代替LSH呢?既然ScSPM,LLC等新提出的方法一致地好于BOW,那能否直接用这些稀疏模型代替BOW来表示图像的特征?粗略想了一下,心中逐渐对这两个问题有了答案。这篇博文我就试图在检索问题上,谈一谈Bag-of-words模型与LSH存在的必要性。转载 2014-06-30 12:32:47 · 1112 阅读 · 0 评论 -
实践:使用FLANN.LSH进行检索
OpenCV的FLANN库相对于原始FLANN库功能较少;比如不能直接使用flann::Matrix data ();原创 2014-04-01 20:05:54 · 4337 阅读 · 0 评论 -
***K近邻Survey-Distance总结
从K近邻算法、距离度量谈到KD树、SIFT+BBF算法:一个人坚持自己的兴趣是比较难的,因为太多的人太容易为外界所动了,而尤其当你无法从中得到多少实际性的回报时,所幸,我能一直坚持下来。毕达哥拉斯学派有句名言:“万物皆数”,最近读完「微积分概念发展史」后也感受到了这一点。同时,从算法到数据挖掘、机器学习,再到数学,其中每一个领域任何一个细节都值得探索终生,或许,这就是“终生为学”的意思。转载 2014-03-25 13:45:26 · 1496 阅读 · 0 评论 -
SVD分解.潜语义分析.PythonCode
Latent Semantic Analysis (LSA)也被叫做Latent Semantic Indexing (LSI),从字面上的意思理解就是通过分析文档去发现这些文档中潜在的意思和概念。假设每个词仅表示一个概念,并且每个概念仅仅被一个词所描述,LSA将非常简单(从词到概念存在一个简单的映射关系).潜在语义分析常用于分析数据헤对象데内在关联。转载 2014-01-18 15:51:55 · 2710 阅读 · 0 评论 -
SIFT算法总结:用于图像搜索
SIFT算法问题:而后面的特征向量以及匹配严重依赖主方向,一旦有偏差效果会显著下降; 图层金字塔的层如何取是个问题,如果取得不够紧密,会在匹配时出现偏差;大片平滑区域时,由于会过滤掉低对比度的点,因此特征点的提取有问题;4高维向量如何构建倒排索引并实现近似检索,是个难题;VA-file+ 的方法并不能完全解决问题。转载 2014-01-15 20:04:01 · 3181 阅读 · 0 评论 -
Approximate Nearest Neighbors.接近最近邻搜索
Approximate Nearest Neighbors为接近最近邻搜索,是查找准确度和查找时间데平衡。本文大致介绍了,K决策树、헤一些哈希方法。原创 2014-02-13 16:31:23 · 4955 阅读 · 0 评论 -
决策树:特征分布空间划分方法
如何快速而准确地找到查询点的近邻,不少人提出了很多高维空间索引结构和近似查询的算法。一般说来,索引结构中相似性查询有两种基本的方式:一种是范围查询,范围查询时给定查询点和查询距离阈值,从数据集中查找所有与查询点距离小于阈值的数据另一种是K近邻查询,就是给定查询点及正整数K,从数据集中找到距离查询点最近的K个数据,当K=1时,它就是最近邻查询。转载 2014-03-25 14:10:23 · 9565 阅读 · 2 评论 -
相似图像识别检 —基于图像签名(LSH)
参考:人工智能,一种现代方法 第 617页,且原始论文给出了完整的证明过程。在ANN方法中,LSH算一种可靠的紧邻算法。少量检索使用KNN、大量检索使用K-Dtree、海量检索使用LSH,超海量检索使用......转载 2014-06-30 14:50:23 · 4526 阅读 · 0 评论 -
“局部图像特征描述概述”--樊彬老师
局部图像特征描述的核心问题是不变性(鲁棒性)和可区分性。由于使用局部图像特征描述子的时候,通常是为了鲁棒地处理各种图像变换的情况。因此,在构建/设计特征描述子的时候,不变性问题就是首先需要考虑的问题。转载 2013-10-29 19:13:26 · 1898 阅读 · 0 评论 -
CBIR--Survey.C/GPU优化.Sys搭建
基于内容的图像检索(英语:Content-based image retrieval,CBIR;或content-based visual information retrieval),属于图像分析的一个研究领域。基于内容的图像检索目的是在给定查询图像的前提下,依据内容信息或指定查询标准,在图像数据库中搜索并查找出符合查询条件的相应图片。原创 2013-10-08 22:23:06 · 1383 阅读 · 0 评论 -
图像特征理论综述
前言: 关于集合:在计算机科学领域,离散数学是非常重要的学科,在图像处理领域,这种重要性更加直观。 一:特征可靠性的来源:1. 数据离散化: 系统观测理论:物理世界存在某一实体,若对其进行描述和解析,需要观测系统及系统所提供的接口。作为图像分析系统的接口,实现的功能是完成实体的图像化,即是实体的可视化。 实体与人的视...翻译 2014-11-16 14:12:37 · 1809 阅读 · 0 评论 -
个人技术博客的选择:CSDN、博客园、简书、知乎专栏还是Github Page?
文章链接:个人技术博客的选择:CSDN、博客园、简书、知乎专栏还是Github Page? 感觉还是Fuck The Dog!看来还是以后把文章写在本地,然后再上传到CSDN吧。被CSDN的缓存机制坑了几次,得非常注意这次事件才行!!!...转载 2018-06-19 17:21:50 · 4772 阅读 · 0 评论