- 博客(16)
- 资源 (4)
- 问答 (1)
- 收藏
- 关注
转载 字符串匹配之KMP
这两天仔细的学了一下KMP算法,本来自己试着以自己的方式记录下自己的学习过程,但是写着写着便不知道自己在说什么了,不知如何组织自己的语言了。自己还是需要修炼,但是为了记录自己的学习过程,只好转载一篇July大神写的,原文链接地址:http://blog.csdn.net/v_JULY_v/article/details/6545192引言 在此之前,说明下写作本文的目的:1、之前
2013-07-25 20:22:17 770
原创 数组连续子数组最大和最大乘积
题目:给定一个数组,要求其连续子数组的最大和。如数组为{6,-3,-2,7,-15,1,2,2},连续子数组的最大和为8(从第0个开始,到第3个为止)解法1:首先最容易想到的便是利用枚举的方法,枚举出所有可能大小的连续子数组的和,然后选出其中最大的一个。即从连续子数组的大小为1一直到n,分别计算它们的和,最后选出使和最大的那个子数组。这种方法的实现比较简单,只需要三重循环即可。然而这种实现方法
2013-07-24 07:18:25 3186
原创 二叉树相关面试题集锦
前言 在面试过程中,关于二叉树的面试题绝对不在少数,这一块也是各个公司喜欢出的考题。本文总结了一些经典的关于二叉树的面试题,本文会持续更新。在本文中涉及的二叉树节点没有特别声明的情况则默认为:typedef struct BTNode{ int _value; BTNode* _left; BTNode* _right;}BTNode* pBTNode;正文题
2013-07-20 22:05:41 1255
转载 编辑距离、拼写检查与度量空间:一个有趣的数据结构
本文除代码外,其余转自Matrix67大神的博客,原文链接地址:点击打开链接,声明:本文只作为个人知识备份之用除了字符串匹配、查找回文串、查找重复子串等经典问题以外,日常生活中我们还会遇到其它一些怪异的字符串问题。比如,有时我们需要知道给定的两个字符串“有多像”,换句话说两个字符串的相似度是多少。1965年,俄国科学家Vladimir Levenshtein给字符串相似度做出了一个明确的定
2013-07-20 20:09:49 772
翻译 Trie树的双数组实现
本文原文链接:点击打开链接正文组织1.什么是Trie树?2.如何实现一个Trie树?3.三数组Trie(Tripple-Array Trie)4.双数组Trie(Double-Array Trie)5.后缀压缩6.关键词插入操作7.关键词删除操作8.双输出池分配(Double-Array Pool Allocation)9.实现DFA:Determine
2013-07-20 11:26:27 3711
原创 Trie树解析
前言 我们都知道在用搜索引擎进行搜索时,当我们输入部分搜索关键词后,搜索引擎会自动给出一些相似的查询关键词,如在百度输入“Trie”之后,它会自动给出可能与Trie相关的查询。除此之外,我们知道在搜索已经的索引过程中,一个词的词频(TF)的作用很大,那么如何能够快速的统计出一个词在某一篇文档中出现的频率呢?
2013-07-20 08:00:29 867
转载 C++ 虚函数表解析
本文转载自:http://blog.csdn.net/haoel/article/details/1948051/,声明:本文仅作为个人知识备份之用前言 C++中的虚函数的作用主要是实现了多态的机制。关于多态,简而言之就是用父类型别的指针指向其子类的实例,然后通过父类的指针调用实际子类的成员函数。这种技术可以让父类的指针有“多种形态”,这是一种泛型技术。所谓泛型技术,说白了就是
2013-07-20 07:14:28 505
原创 排列与组合问题
一、排列1.1 生成全排列 所谓排列,就是指从给定个数的元素中取出指定m个数的元素进行排序,其中0 方案1:首先最容易想到的便是按照排列的定义进行枚举,即用一个大小为n的布尔数组标识集合中对应下表的元素是否已经占用。假设当前排列的1到k的位置的元素已经确定,那么在确定k+1位置上的元素时,根据布尔数组的标识情况,选择一个尚未在前k个元素中出现的元素作为当前元素,然后
2013-07-19 17:03:05 975
转载 TF-IDF与余弦相似性的应用(三):自动摘要
本文转自:http://www.ruanyifeng.com/blog/2013/03/automatic_summarization.html,声明:本文仅作为个人知识备份之用有时候,很简单的数学方法,就可以完成很复杂的任务。这个系列的前两部分就是很好的例子。仅仅依靠统计词频,就能找出关键词和相似文章。虽然它们算不上效果最好的方法,但肯定是最简便易行的方法。今天,依然继续这个
2013-07-19 09:55:30 566
原创 k路归并排序
题目:给定k个已序链表,要求尽可能快的将这k个链表合并为一个有序链表。方案1:将这k个链表标号为1,2,...,k,对于这k个链表,我们首先合并链表1和链表2,得到一个有序的链表L12,然后将L12和链表3进行合并...直到k个链表均合并完成,最终便能够得到有序的链表L1k,即为这k个链表合并后的有序链表。对于这种思路,可以写出如下的C++代码:LinkList mergeList(L
2013-07-19 09:49:31 2490
转载 Young氏矩阵
文章转载自:http://shmilyaw-hotmail-com.iteye.com/blog/1721524,声明:本文只作为知识备份之用简介 杨氏矩阵是在很多面试和讨论中用到比较多的一个话题。它本身独特的构造使得它的一些增删查改的操作和堆排序以及二分搜索的思想很类似。它本身问题不难,实际操作的时候会稍微有点繁琐。问题 假定我们有一个mxn的矩阵,它的每一行
2013-07-19 07:15:52 710
转载 求字符串的最长回文串的O(n)解法
转载地址:http://leetcode.com/2011/11/longest-palindromic-substring-part-ii.html,声明:本文仅作为知识备份之用Given a string S, find the longest palindromic substring in S.Note:This is Part II of the articl
2013-07-18 21:51:08 781
转载 贝叶斯推断及其互联网应用(二):过滤垃圾邮件
声明:本文转自http://www.ruanyifeng.com/blog/2011/08/bayesian_inference_part_two.html,纯粹作为知识备份之用。七、什么是贝叶斯过滤器?垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。前者的过滤依据是特定的词语;
2013-07-18 15:12:33 743
转载 贝叶斯推断及其互联网应用(三):拼写检查
本文转自http://www.ruanyifeng.com/blog/2012/10/spelling_corrector.html,纯粹作个人知识备份之用使用Google的时候,如果你拼错一个单词,它会提醒你正确的拼法。比如,你不小心输入了seperate。Google告诉你,这个词是不存在的,正确的拼法是separate。这就叫做"拼写检查"(spelling co
2013-07-18 15:09:53 706
转载 编辑距离、拼写检查与度量空间:一个有趣的数据结构(转)
本文转自http://www.matrix67.com/blog/archives/333,纯粹个人作知识备份之用除了字符串匹配、查找回文串、查找重复子串等经典问题以外,日常生活中我们还会遇到其它一些怪异的字符串问题。比如,有时我们需要知道给定的两个字符串“有多像”,换句话说两个字符串的相似度是多少。1965年,俄国科学家Vladimir Levenshtein给字符串相似度做出了
2013-07-18 15:07:31 534
转载 网页排重算法(转)
本文转自http://blog.chinaunix.net/uid-1755993-id-2866390.html,纯粹个人作备份之用1.1 信息指纹算法判断重复网页的思想:为每个网页计算出一组信息指纹(Fingerprint),若两个网页有一定数量相同的信息指纹,则认为这两个网页的内容重叠性很高,也就是说两个网页是内容复制的。判断内容复制的方法中最关键的两点:1、计算信息指纹
2013-07-18 15:03:04 1085
使用gperftools分析性能生成的pdf文件没有函数调用关系
2016-06-23
TA创建的收藏夹 TA关注的收藏夹
TA关注的人