算法
文章平均质量分 88
sealyao
这个作者很懒,什么都没留下…
展开
-
Aho-Corasick算法学习
1、概述Aho-Corasick自动机算法(简称AC自动机)1975年产生于贝尔实验室。该算法应用有限自动机巧妙地将字符比较转化为了状态转移。此算法有两个特点,一个是扫描文本时完全不需要回溯,另一个是时间复杂度为O(n),时间复杂度与关键字的数目和长度无关。好了,我们先看下最原始的多模式匹配算法:主串T,n=strlen(T)。模式串Pi mi = strlen(pi) for原创 2009-09-16 21:39:00 · 35854 阅读 · 8 评论 -
BP神经网络算法学习
BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。一个神经网络的结构示意图如下所示。BP神经网络模型拓扑结构包括输入层(input)、隐层(hide原创 2011-06-11 17:34:00 · 114547 阅读 · 15 评论 -
朴素贝叶斯与贝叶斯信念网络
贝叶斯分类是统计学分类方法。它们可以预测类成员关系的可能性,如给定样本属于一个特定类的概率。贝叶斯定理是就是在给定的数据概率来表示未知的后验概率。比如已知某水果是红色的情况下,判断该水果有多大的概率是苹果,用数学符号表示就是(后验概率),其中X表示“这个水果是红色的”,H表示“这个水果是苹果”。这个概率我们是不知道的,但是如果我们有大量的水果样本,就可以计算水果样本中的统计信息来逼近这个概率。原创 2011-06-11 09:38:00 · 28304 阅读 · 5 评论 -
决策树算法学习
决策树是一个类似于流程图的树结构;其中,每个内部结点表示在一个属性上的测试,每个分枝代表一个测试输出,而每个树叶结点代表类或类分布。树的最顶层结点是根结点。一棵典型的判定树如下图。这是一个用于预测不同的天气条件下比赛是否能如期举行。ID3算法下面是著名的ID3算法的伪代码:Generate_decision_tree(samples,attribute_list){原创 2011-06-08 08:23:00 · 12663 阅读 · 0 评论 -
关联挖掘算法Apriori和FP-Tree学习
关联挖掘算法 Apriori算法和FPTree算法原理,伪码和举例说明原创 2011-06-02 08:52:00 · 46280 阅读 · 12 评论 -
svm中的数学和算法
SVM中的数学推导和SMO算法基本原理。原创 2011-05-24 15:02:00 · 26970 阅读 · 11 评论 -
开源正则库及其使用
说起正则表达式(Regular Expression),也许有的朋友天天都在使用,比如grep、vim、sed、awk,只是可能对这个名词不大熟悉。正则表达式一般简写为regex或者regexp,甚至是RE。关于正则表达式的介绍,有很多的文章,用搜索引擎查找就可以找到很不错的使用说明。但是在C/C++语言中如何去使用,相应的介绍比较缺乏。大多数C标准库自带regex,可以通过/usr/includ转载 2010-01-07 11:23:00 · 6928 阅读 · 1 评论 -
扩展AC算法的正则特性
可以在AC算法上扩展的正则特性包括:“.*”,“.”,“^”,“$”等。AC算法的查找流程: typedef struct _acsm_pattern { unsigned char *patstr; //pattern 字符串 unsigned int iid; //pattern id号} ACSM_PATTERN;typedef原创 2010-01-26 18:11:00 · 3316 阅读 · 1 评论 -
正则表达式DFA构造方法
陈梓瀚 vczh@163.com http://www.cppblog.com/vczh/1、问题概述随着计算机语言的结构越来越复杂,为了开发优秀的编译器,人们已经渐渐感到将词法分析独立出来做研究的重要性。不过词法分析器的作用却不限于此。回想一下我们的老师刚刚开始向我们讲述程序设计的时候,总是会出一道题目:给出一个填入了四则运算式子的字符串,写程序计算该式子的结果。除此之外,我们有时候转载 2009-09-19 09:50:00 · 24398 阅读 · 27 评论 -
Boyer-Moore算法学习
1、概述在用于查找子字符串的算法当中,BM(Boyer-Moore)算法是目前相当有效又容易理解的一种,一般情况下,比KMP算法快3-5倍。BM算法在移动模式串的时候是从左到右,而进行比较的时候是从右到左的。常规的匹配算法移动模式串的时候是从左到右,而进行比较的时候也是是从左到右的,基本框架是:j = 0;while(j <= strlen(主串)- strlen(模式串)原创 2009-09-18 21:59:00 · 65865 阅读 · 19 评论 -
ACBM算法
ACBM算法:ACBM算法是在AC自动机的基础之上,引入了BM算法的多模扩展,实现的高效的多模匹配。和AC自动机不同的是,ACBM算法不需要扫描目标文本串中的每一个字符,可以利用本次匹配不成功的信息,跳过尽可能多的字符,实现高效匹配。 比如:{P} = {her,wh原创 2011-09-24 19:10:15 · 17965 阅读 · 0 评论