Algorithm Instruction
文章平均质量分 85
Walter_Jia
性格开朗,爱好广泛(篮球、象棋、游泳等),网络安全领域协议识别,Linux研发,希望和您成为真心朋友。
展开
-
AC_Trie字符串搜索算法介绍
转载:http://www.cnblogs.com/dolphin0520/archive/2011/10/11/2207886.html Trie树 Trie树也称字典树,因为其效率很高,所以在在字符串查找、前缀匹配等中应用很广泛,其高效率是以空间为代价的。一.Trie树的原理原创 2013-05-03 10:48:47 · 1290 阅读 · 0 评论 -
【算法分析】ACBM算法分析
1977年,Robert S.Boyer和J Strother Moore提出了另一种在O(n)时间复杂度内,完成字符串匹配的算法,其在绝大多数场合的性能表现,比KMP算法还要出色,下面我们就来详细了解一下这一出色的单模式匹配算法,在此之前推荐读者读一下我的另一篇文章《KMP算法详解》,对于透彻理解BM算法大有裨益。在讲解Boyer-Moore算法之前,我们还是要提一提KMP算法的老例子,当模原创 2014-08-05 14:40:22 · 2778 阅读 · 0 评论 -
【python 编程】文本分类KNN算法实现及结果输出
KNN算法实现文本分类ascii系统 5账号 2密码 2分辨率 2用户名 1用户 1软件 1苹果 1密码技术 1宽度 1火狐 10、rd-doc—count矩阵分辨率 2 22 [1, 1]用户名 1 12 [1, 1]鼠标 0 11 [0, 1]密码技术 1 12 [1, 1]密码 2 22 [1, 1]原创 2014-05-14 16:02:51 · 9685 阅读 · 0 评论 -
【Python 编程】实现文本分类中的信息增益算法
def IG_count(c1,c2): list1 = [] list2 = [] list3 = [] dict1 = dict() ig_dict = dict() class_count = 2 doc_count = 3 c1_file = open(c1,"r") #c1_wo原创 2014-05-13 19:37:13 · 6195 阅读 · 1 评论 -
【文本分类】friso中文分词器介绍(c 开源)
一、friso中文分词器Friso是使用c语言开发的一款高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入到其他程序中,例如:MySQL,PHP等。同时支持对UTF-8/GBK编码的切分。【源码无需修改就能在各种平台下编译使用,加载完20万的词条,内存占用稳定为14.5M。】1。目前最高版本:friso 1.6.0,同时支持对UT原创 2014-02-12 17:16:37 · 4101 阅读 · 0 评论 -
【文本分类】中文分词开源软件介绍
链接:http://www.oschina.net/project/tag/264/segment 开源中国社区1、IKAnalyzerIKAnalyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始,IKAnalyzer已经推出 了3个大版本。最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的原创 2014-02-12 16:42:25 · 4163 阅读 · 0 评论 -
【文本分类】文本分类流程及算法原理
分类体系分类:给定一个对象,从一个事先定义好的分类体系中挑出一个或多个最适合该对象的类别。文本分类(TC, Text Categorization):在给定的分类体系下,根据文本内容自动的确定文本关联的类别。从数学角度看,文本分类是一个映射的过程,它将未标明类别的文本映射到已有的类别中,该映射可以是一对一或一对多的映射。 f:A→B 其中,A表示待分类的文本集合,B表示分类原创 2014-02-23 18:33:23 · 19046 阅读 · 0 评论 -
Ac算法分析
例如{“he”,"she","his"}模式生成状态机过程如下:1、首先利用acsmNew 初始化结构体ACSM_PATTERN,ACSM_STATETABLE,ACSM_STRUCT,其中ACSM_PATTERN保存每个字符串,在函数acsmAddPattern中采用倒插法将3原创 2011-07-17 13:39:11 · 1431 阅读 · 0 评论 -
AC算法
http://blog.chinaunix.net/u/12592/showart_284591.html可下载源代码这几天一直都在看多模式匹配的算法,昨天为了赶着能够在信息检索的课上show一下,就赶工写了一个AC算法的程序。实际上程序大部分代码来自于Snort,我做了一定的修改,将NFA和转化为DFA的函数合并到了一块,并且删除了很多冗余的变量和函数,感觉Snort代码写的有些乱,自我原创 2009-08-24 20:50:00 · 2894 阅读 · 1 评论 -
IDEA数据加密算法
1、简介IDEA是International Data Encryption Algorithm 的缩写,是1990年由瑞士联邦技术学院来学嘉X.J.Lai和Massey提出的建议标准算法称作PES( Proposed Encryption Standard) 。Lai和Massey在1992年进行了改进强化了抗差分分析的能力改称为IDEA它也是对原创 2010-02-21 17:12:00 · 29693 阅读 · 3 评论 -
AC_BM算法的实现
AC_BM算法在内容过滤中的实现1.另一个相似算法的介绍http://www.win.tue.nl/~watson/2R080/opdracht/p333-aho-corasick.pdf2.AC_BM的实现(为我的设计和总结) 43.ac_bm 在内容过滤中的应用... 7AC_BM算法在模式匹配中的实现在了解AC_BM实现之前,请参阅纪烨的。(见附录一)由于只给出了AC_BM的工作过程与实现思原创 2009-08-24 20:48:00 · 3082 阅读 · 0 评论 -
AC算法实例
from :http://www.cublog.cn/u/12592/showart_284591.htmlAC算法实现这几天一直都在看多模式匹配的算法,昨天为了赶着能够在信息检索的课上show一下,就赶工写了一个AC算法的程序。实际上程序大部分代码来自于Snort,我做了一定的原创 2011-07-07 23:15:10 · 2359 阅读 · 0 评论