自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

转载 BloomFilter——大规模数据处理利器

Bloom Filter是由Bloom在1970年提出的一种多哈希函数映射的快速查找算法。通常应用在一些需要快速判断某个元素是否属于集合,但是并不严格要求100%正确的场合。 一. 实例   为了说明Bloom Filter存在的重要意义,举一个实例:  假设要你

2011-09-13 10:25:02 451

转载 动态规划经典题目

第一题:     给定一个整数序列A={a1,a2,...,an},求它的最长递增子序列。比如,A={1,2,6,4,5}的最长递增子序列为{1,2,4,5},长度为4.     背景:最长递归子序列问题应该算是DP的一个比较经典的应用了。解法一:     直接D

2011-09-02 15:31:55 1131

原创 关于内存对齐

//环境:vc6 + windows sp2//程序1#include iostream>using namespace std; struct st1 {    char a ;    int  b ;    short c ;};

2011-08-05 10:51:12 367

转载 转载 基于HMM模型的词性标注

HMM,它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数(后面要讨论到的Viterbi算法)。然后利用这些参数来作进一步的分析,例如模式识别。在中文信息处理方面,它主要用于词性标注,计算机并不知道一句话中某个词的具体词性,需要通过相应的模型和算法来使计算机能够识别出一句话中具体某个词的词性,那么模型就是某个HMM,算法就是在此模型上的Viterbi算法。 我的工作是以北大1998年1月份的语料为基础,求出此HMM,然后在这个HMM的基础之上设计Viter

2011-03-14 22:41:00 1495

原创 平衡二叉树

<br />二叉树支持动态的插入和查找,保证操作在O(height)时间,这就是完成了哈希表不便完成的工作,动态性。但是二叉树有可能出现worst-case,如果输入序列已经排序,则时间复杂度为O(N) <br /><br />平衡二叉树/红黑树就是为了将查找的时间复杂度保证在O(logN)范围内。 <br />所以如果输入集合确定,所需要的就是查询,则可以考虑使用哈希表,如果输入集合不确定,则考虑使用平衡二叉树/红黑树,保证达到最大效率

2011-03-14 22:40:00 514

原创 查找算法

<br />二叉树支持动态的插入和查找,保证操作在O(height)时间,这就是完成了哈希表不便完成的工作,动态性。但是二叉树有可能出现worst-case,如果输入序列已经排序,则时间复杂度为O(N) <br /><br />平衡二叉树/红黑树就是为了将查找的时间复杂度保证在O(logN)范围内。 <br />所以如果输入集合确定,所需要的就是查询,则可以考虑使用哈希表,如果输入集合不确定,则考虑使用平衡二叉树/红黑树,保证达到最大效率

2011-03-14 17:07:00 387

原创 排序

1. 排序方法的分类稳定的排序用'Y'表示,不稳定的排序用'N'表示插入排序:直接插入排序(Y)、希尔排序交换排序:冒泡排序(Y)、快速排序(N)选择排序:直接选择排序(N)、堆排序(N)归并排序:二路归并排序(Y)2. 排序方法的特点快速排序:适合对无序记录排序,平均性能最好,时间复杂度为O(nlogn)直接插入排序:从待排序列中依次取出元素与已排子序列比较,找出在已排子序列中的位置。元素有序时比较次数最少。冒泡排序:每一趟把最大元素置后选择排序:从待排序列中选出最小的元素,放在已排子序列的末端。能在排序

2011-03-14 09:42:00 438

原创 动态规划理解

理解动态规划有三个要点:问题必须可多阶段决策的,问题必须是有最优子结构的,问题必须是无后效性的。  套用维特比算法会比较好理解 。在具有N个状态,M个观测序列组成的路径矩阵中,寻找最优路径,全局最优路径必定是前M-1个观测序列的最优路径,再加上从M-1到M的最优路径组

2011-03-13 22:03:00 753

原创 软件开发中的解耦

<br />项目进入关键期了,最近一个礼拜不断加班写代码,回顾一年以来经历过的项目,突然发现其实我们一直在追求的就是解耦,目的就是使自己的软件系统能够以更低的代价接受变化,比如增加新业务时,希望不用修改代码或者少修改。<br /> <br />代码级别的解耦是最常见的,把OOA/OOD做的更好一些,每个类的职责明确,接口功能尽量细分,多使用经典的设计模式,这样的代码也比较容易看懂。<br /> <br />软件一般都分层设计,比如1:数据层,2:数据加工转发层,3:业务逻辑层,4:展现层,层与层之间也需要尽

2011-03-11 09:15:00 6126

原创 一个开始

<br />    今天是新年的第三个工作日,创建了自己的CSDN博客,同样是一个新的开始。这个博客将主要记录专业技术上的文章,特别是NLP相关的。一直对NLP有很大的兴趣,遗憾的是,工作内容和它无关。努力改变,努力争取,希望能为兴趣工作~~~

2011-02-11 11:46:00 431

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除