算法
文章平均质量分 96
dfsj66011
这个作者很懒,什么都没留下…
展开
-
geeksforgeeks —— 算法 1
目录算法一、查找和排序1.1 线性查找1.2 二分查找1.3 跳跃搜索1.4 插值搜索1.5 指数搜索1.6 为什么二元搜索优于三元搜索?1.7 选择排序1.8 冒泡排序1.9 插入排序1.10 归并排序1.11 堆排序1.12 快速排序geeksforgeeks 上有很多不错的基础性计算机学科知识,其风格不过多注重理论,也不是一味的像 leetcode 那种刷题,每一篇内容篇幅安排的都较短,也有一定的知识组织架构,非常适合初学者或作为工具字典书定向查阅相关内容。该合集内容主要针对的是算法与数据结构.翻译 2021-05-29 17:04:06 · 951 阅读 · 0 评论 -
Simhash 与汉明距离问题求解
目录Simhash 与汉明距离问题求解simhash 的生成图像的处理求解汉明距离问题表的存储其他配置Simhash 与汉明距离问题求解Simhash 是一种聪明的方法,可以在一个大语料库中快速找到几乎相同的文档(或其他项目),而不必单独将每个文档和其他文档进行比较。对任何规模的语料库使用 simhash 包含两个部分:生成 simhash本身和解决汉明距离问题。二者缺一不可。与 minhash 不同,simhash 方法实际上不允许完全相似性检测,因为它敏感的相似性范围非常小。最好用近似重复检测来描.翻译 2021-05-12 15:54:52 · 675 阅读 · 0 评论 -
基数统计—— HyperLogLog 算法
目录基数计数基本概念基数计数方法B树bitmap概率算法HLL直观演示HLL 的实际步骤算法来源(N次伯努利过程)解释LogLogCounting均匀随机化分桶平均偏差修正误差分析算法应用误差控制内存使用分析合并HyperLogLog Counting基本算法偏差分析分段偏差修正结论并行化应用场景参考阅读文章主体内容来自于 神奇的 HyperLogLog 算法,原创链接貌似已失效,可参照大概是其转载内容 HyperLogLog ,本文在此基础上略有删改。基数计数基本概念**基数计数(cardin.原创 2021-04-24 14:59:53 · 459 阅读 · 0 评论