![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据结构与算法
文章平均质量分 76
咚伢
linux C
展开
-
海量数据去重与布隆过滤器
海量数据去重的应用场景有很多,例如在使用word文档的时候,如何判断某个单词是否拼写正确;网络爬虫程序,如何不去爬取相同的url页面;垃圾邮件过滤等。这就涉及到了海量数据去重。 我们将问题简化: ‘如何从海量数据中查询某字符串是否存在。’ 常用查询数据结构 set and map C++ STL中的set和map都可以用来进行查询。他们都是采用红黑树来实现的,增删查改的事件复杂度为o(logn),这里不多展开介绍 优点:存储效率高,访问速度高 缺点:对于数据量大且查询字符串比较场且查询字符串相似时将会是原创 2021-05-16 10:48:33 · 209 阅读 · 0 评论 -
数据结构1—希尔,KMP(只挂个代码),链表简单题
数据结构1—希尔,KMP,链表简单题 业务代码写了几个月,深感脱离了业务,感觉不剩下啥,特此进行一些基础复习。 希尔排序 希尔排序的核心思想:分组+插排 分组 以gap = length / 2分组,从第一个元素开始,每间隔gap个元素划分为一组,以此类推。当gap为1时,即每组剩余一个元素,此时排序完成。 组内排序 通过插入排序来对每组元素进行排序。 /* * @param * data : data * length: length of data * @re原创 2021-04-25 20:58:15 · 68 阅读 · 0 评论