检索算法
文章平均质量分 80
CCV_Edward
从事图像处理,图像检索等研究,刚刚起步,需要能多多交流
展开
-
常用 Hash 算法冲突解决方法分析
下面是我直接复制的,有不懂的欢迎qq交流:1281907942看了ConcurrentHashMap的实现, 使用的是拉链法.虽然我们不希望发生冲突,但实际上发生冲突的可能性仍是存在的。当关键字值域远大于哈希表的长度,而且事先并不知道关键字的具体取值时。冲突就难免会发 生。另外,当关键字的实际取值大于哈希表的长度时,而且表中已装满了记录,如果插入一个新记录,不仅发生冲突,而转载 2016-10-23 19:14:34 · 273 阅读 · 0 评论 -
简单易懂讲解simhash算法 hash 哈希
原文来自:http://blog.csdn.net/le_le_name/article/details/51615931通过 采集系统 我们采集了大量文本数据,但是文本中有很多重复数据影响我们对于结果的分析。分析前我们需要对这些数据去除重复,如何选择和设计文本的去重算法?常见的有余弦夹角算法、欧式距离、Jaccard相似度、最长公共子串、编辑距离等。这些算法对于待比较的文本数据不多时转载 2016-10-23 19:16:22 · 845 阅读 · 0 评论 -
ITQ(Iterative Quantization)迭代量化方法详解 hash 哈希算法
看过的文章,不做记录,即便当时理解透了,过一段时间后,知识总会模糊不清。所以从现在开始,对一些自己阅读过的一些精彩的文章,悉心记录,方便自己查阅温故,当然如果对同行有所裨益的话,亦是一件开心的事。好了,回归正题。这篇文章发表在2011年CVRP上,一作是Yunchao Gong,师从Sanjiv Kumar,关于Sanjiv Kumar可以到她的HomePage上了解。 这转载 2016-10-23 19:17:39 · 1851 阅读 · 0 评论 -
经典的hash算法 常见hash 哈希算法
计算理论中,没有Hash函数的说法,只有单向函数的说法。所谓的单向函数,是一个复杂的定义,大家可以去看计算理论或者密码学方面的数据。用“人 类”的语言描述单向函数就是:如果某个函数在给定输入的时候,很容易计算出其结果来;而当给定结果的时候,很难计算出输入来,这就是单项函数。各种加密函 数都可以被认为是单向函数的逼近。Hash函数(或者成为散列函数)也可以看成是单向函数的一个逼近。即它接近于满足单向转载 2016-10-23 19:18:37 · 1016 阅读 · 0 评论 -
图像检索----迭代量化(Iterative Quantization)理解
原文出处:http://blog.csdn.net/CHIERYU一.目标数据集为:,每个样本为d维,每个样本为一个行向量。假设所有样本都是0均值的,即满足一下条件: 通过c个函数把每个样本x映射到一个二进制超立方体的一个顶点上,其中是一个列向量。因此得到每个样本x在二进制超立方体上的二进制编码,编码长度c,用矩阵表示描述这个过程就是: 其中sgn函数是转载 2016-10-03 12:29:12 · 621 阅读 · 0 评论 -
海量数据相似度计算之simhash和海明距离
原文来自:http://www.lanceyan.com/tech/arch/simhash_hamming_distance_similarity.html通过 采集系统 我们采集了大量文本数据,但是文本中有很多重复数据影响我们对于结果的分析。分析前我们需要对这些数据去除重复,如何选择和设计文本的去重算法?常见的有余弦夹角算法、欧式距离、Jaccard相似度、最长公共子串转载 2016-10-03 16:15:30 · 662 阅读 · 0 评论