- 博客(13)
- 资源 (9)
- 收藏
- 关注
转载 百度图像搜索探秘
昨天,百度上线了新的相似图(similarimage search)搜索,试了风景、人物、文字等不同类型query的效果,感觉效果非常赞。尤其对于人物搜索,返回的结果在颜色、以及姿态方面具有非常大的相似性。特别是在输入某个pose的美女图片时,会搜到一系列相近pose的美女图片,真的是宅男之福啊。本着娱乐精神,贴一个搜索结果供大家yy。我们知道这个产品底层的技术是余凯老师领导的
2015-05-27 09:28:28 2706
原创 概念主题模型简记
概念主题模型(PTM, probabilitytopical model)在自然语言处理(NLP,natural language processing)中有着重要的应用。主要包括以下几个模型:LSA(latentsemantic analysis)、 PLSA(probability latent semantic analysis)、LDA(latentdirichlet allocati
2015-05-23 13:13:17 7690 1
转载 文本语言模型的参数估计-最大似然估计、MAP及贝叶斯估计
转自:http://blog.csdn.net/yangliuy/article/details/8296481以PLSA和LDA为代表的文本语言模型是当今统计自然语言处理研究的热点问题。这类语言模型一般都是对文本的生成过程提出自己的概率图模型,然后利用观察到的语料数据对模型参数做估计。有了语言模型和相应的模型参数,我们可以有很多重要的应用,比如文本特征降维、文本主题分析等等。本文主要介绍
2015-05-23 12:58:46 2283
原创 奇异值分解及应用(PCA&LSA)
这里我省去了很多的数学知识,建议数学比较薄弱的读者可以先看看信息检索导论>第18章。主要的数学知识包括方阵的特征值、特征向量;方阵的对角化;一般矩阵的奇异值分解及低秩逼近矩阵。这里主要讲解奇异值分解的两个应用PCA(降维)和LSA(潜在语义结构分析)。PCA:之前有详细讲过PCA,http://blog.csdn.net/lu597203933/article/details/415445
2015-05-21 23:10:48 4138
转载 相似图片搜索原理四(内容特征法)
说明:这里为阮一峰的一篇blog:http://www.ruanyifeng.com/blog/2013/03/similar_image_search_part_ii.html,其中颜色分布法就是颜色直方图的一种,我的上一遍blog阐述过了。二年前,我写了《相似图片搜索的原理》,介绍了一种最简单的实现方法。昨天,我在isnowfy的网站看到,还有其他两种方法也很简单,这里做一些笔
2015-05-17 23:11:43 3038
原创 相似图片搜索原理三(颜色直方图—c++实现)
图像的颜色直方图可以用于图像检索,适应有相同色彩,并且可以有平移、缩放、旋转不变性的图像检索,当然了这三大特点不如sift或者surf稳定性强,此外最大的局限就是如果形状内容一样,但色彩不一,结果是搜不到的。不过它在某些情况下达到较好的结果。颜色直方图两种计算方式:彩色图像的颜色直方图,这里可以有两种处理方式,得到的效果应该差不多。 首先第一种就是对像素的每个通道都进行划分
2015-05-17 23:04:27 6191 3
原创 相似图片搜索原理二(phash—c++实现)
前段时间介绍过相似图片搜索原理一(ahash)http://blog.csdn.net/lu597203933/article/details/45101859,它是基于内容检索最简单的一种;这里介绍它的增强版本感知哈希算法(perceptual hash, phash)。它主要也是用缩略图搜原图并能达到较好点的效果.理论部分:理论部分主要包括以下几个步骤: 图像缩放—将图像缩
2015-05-17 22:08:13 8302 1
原创 贝叶斯网络
贝叶斯网络、马尔科夫随机场(MRF, Markov RandomField)和因子图都属于概念图,因此它们都归属于机器学习中的概念图模型(PGM,Probability Graphical Model).一:定义贝叶斯网络,又称信念网络(Belief Network, BN),或有向无环图模型,是由一个有向无环图(DAG,Directed acyclic graphical model
2015-05-16 10:23:34 8510
原创 最大熵模型简记
最近两天简单看了下最大熵模型,特此做简单笔记,后续继续补充。最大熵模型是自然语言处理(NLP, nature language processing)被广泛运用,比如文本分类等。主要从分为三个方面,一:熵的数学定义;二:熵数学形式化定义的来源;三:最大熵模型。注意:这里的熵都是指信息熵。一:熵的数学定义:下面分别给出熵、联合熵、条件熵、相对熵、互信息的定义。 熵:如果一个随机
2015-05-11 22:55:48 2942
原创 leetcode 专题—sort
此将主要将leetcode中sort专题的解答都放在这里,后续会慢慢加入一:leetcode179 Largest Number题目:Given a list of non negative integers, arrange them such that they form the largest number.For example, given [3, 30, 3
2015-05-06 19:26:34 1912 1
原创 leetcode LinkList专题
此次blog会将leetcode上的linklist专题内容放在这里,后续慢慢添加一:leetcode 206 Reverse Linked List 二:leetcode 92 Reverse Linked List II一:leetcode 206 Reverse Linked List题目:Reverse a singly linked list.代码:
2015-05-06 16:09:34 1056
原创 leetcode 204/187/205 Count Primes/Repeated DNA Sequences/Isomorphic Strings
一:leetcode 204 Count Primes题目:Description:Count the number of prime numbers less than a non-negative number, n分析:此题的算法源码可以参看这里,http://en.wikipedia.org/wiki/Sieve_of_Eratosthenes代码:cl
2015-05-06 14:27:00 1558
转载 以图搜图相关资料
转载出处:blog.csdn.net/carson2005 基于内容的图片检索(Content Based Image Retrieval, CBIR),也有人称之为以图搜图,是一个很老的研究领域,它是利用机器学习、模式识别、计算机视觉等相关技术对图片的内容进行分析、检测、检索的一种应用。随着近年来模式识别与机器学习的快速发展,该领域又逐渐火热起来,并涌现出很多实际可用的商业
2015-05-05 15:48:05 2630
图片检索(均匀hash,感知hash,颜色直方图)
2015-05-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人