数据结构与算法
720_tigerMouse
这个作者很懒,什么都没留下…
展开
-
TF-IDF算法及应用实例
TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用,作为文件与用户查询之间相原创 2014-12-09 14:50:35 · 4825 阅读 · 0 评论 -
堆和栈的区别(转过无数次的文章)
一、预备知识—程序的内存分配 一个由C/C++编译的程序占用的内存分为以下几个部分 1、栈区(stack)— 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。其 操作方式类似于数据结构中的栈。 2、堆区(heap) — 一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回 收 。注意它与数据结构中的堆是两转载 2015-04-13 17:13:01 · 369 阅读 · 0 评论 -
排序算法的实现及性能分析
排序算法的实现及性能分析——(java版)排序是对数据元素序列建立某种有序排列的过程。更确切的说,排序是把一个数据元素序列整理成按关键字递增(或递减)排列的过程。不过首先,我们必须先解释一下关键字这个词。关键字是要排序的数据元素集合中的一个域,排序是以关键字为基准进行的。而关键字也分为主关键字和次关键字。对于要排序的数据元素集合来说,如果关键字满足数据元素值不同时,该关键字也不同,这样转载 2015-04-02 17:03:18 · 1276 阅读 · 0 评论 -
缓存淘汰算法--LRU算法
【本文转载于缓存淘汰算法--LRU算法】1. LRU1.1. 原理LRU(Least recently used,最近最少使用)算法根据数据的历史访问记录来进行淘汰数据,其核心思想是“如果数据最近被访问过,那么将来被访问的几率也更高”。1.2. 实现最常见的实现是使用一个链表保存缓存数据,详细算法实现如下:1. 新数据插入到链表头部;转载 2016-04-27 18:29:44 · 419 阅读 · 0 评论 -
Nginx的负载均衡 - 一致性哈希 (Consistent Hash)
【本文转载于Nginx的负载均衡 - 一致性哈希 (Consistent Hash)】Nginx版本:1.9.1我的博客:http://blog.csdn.net/zhangskd 算法介绍 当后端是缓存服务器时,经常使用一致性哈希算法来进行负载均衡。使用一致性哈希的好处在于,增减集群的缓存服务器时,只有少量的缓存会失效,回源量较小。转载 2016-05-06 19:51:13 · 706 阅读 · 0 评论 -
一致性哈希算法学习及JAVA代码实现分析
【本文转载自一致性哈希算法学习及JAVA代码实现分析】1,对于待存储的海量数据,如何将它们分配到各个机器中去?---数据分片与路由当数据量很大时,通过改善单机硬件资源的纵向扩充方式来存储数据变得越来越不适用,而通过增加机器数目来获得水平横向扩展的方式则越来越流行。因此,就有个问题,如何将这些海量的数据分配到各个机器中?数据分布到各个机器存储之后,又如何进行查找?这里主要记录转载 2016-04-07 18:06:46 · 602 阅读 · 0 评论 -
字符串匹配的KMP算法
【本文转自字符串匹配的KMP算法】 字符串匹配是计算机的基本任务之一。 举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD"? 许多算法可以完成这个任务,Knuth-Morris-Pratt算法(简称KMP)是最常用的之一。它以三个发明者命名,起头的那个K就是著名科学家Donald Knuth。 这种算法不太容易理解,...转载 2018-05-18 15:35:59 · 171 阅读 · 0 评论 -
浅析——B树,B+树,B*树以及分析MySQL的两种引擎
【本文转自浅析——B树,B+树,B*树以及分析MySQL的两种引擎】接触到了数据结构当中的B树,B+树,B*树,我觉得应该写一篇博客记录下,毕竟是第一次接触的,只有写了博客以后,感觉对这个的印象才会更加深刻。 前言: 为什么要有B树? 学习任何一个东西我们都要知道为什么要有它,B树也一样,既然存储数据,我们为什么不用红黑树呢?这个要从几个方面来说了, 计算机有一个局部性原理,就是说,当一个数据被用...转载 2018-06-17 22:06:06 · 469 阅读 · 0 评论