算法
小学生Jack
这个作者很懒,什么都没留下…
展开
-
快速查找list中的大多数元素(数目超过一半的元素)
算法叫Moore's volting,用于线性查找list/vector/array中的majority元素,如果元素出现次数不足一半,不叫majority,不能使用该算法。算法核心思想是majority元素可以抵消掉list中的其他元素,然后仍有剩余。C++实现(输入为vector)int majorityElement(vector &num) { int c原创 2015-01-12 18:15:30 · 906 阅读 · 0 评论 -
大数据下的相似度计算--minHash
简述本文讨论一种在数据量较大的情况下计算两个集合(比如文本)相似度的算法,以及在互联网行业的应用。原始问题当数据量较小时,计算两个文本的相似度可以直接将两个文本表示为向量,然后计算他们的cosine相似度或jaccard相似度。本文所阐述的方法基于后者。jaccard相似度可以看成两个集合A,B的交集占并集的比例:Jaccard Sim = (A∩B) / (A∪B)其实就是计原创 2014-12-31 11:06:54 · 7053 阅读 · 0 评论