算法学习
文章平均质量分 51
笨笨猪的学习之路
这个作者很懒,什么都没留下…
展开
-
以kenlm为例,详细介绍N-gram语言模型
本文为转载https://blog.csdn.net/asrgreek/article/details/81979194的基础上,做了一些推演与推演过程的修正,如有错误欢迎指正。本文以KenlM介绍常用的N-gram语言模型原理。KenlM采用的平滑技术是Modified Kneser-ney smoothing以以下代码段为例介绍,以N=2为例,即2-gram,bigram介绍N-gra...原创 2020-02-07 16:04:32 · 1143 阅读 · 0 评论 -
Ukkonen后缀树算法原理
https://www.cnblogs.com/gaochundong/p/suffix_tree.html本文为节选上述文章,若有问题请联系本人。看了很多相关的文章,都没有解释清楚下面系列图示里面的符号的含义,后来发现这篇文章里面做了详细的介绍,忍不住保留一份,希望能有用。1995 年,Esko Ukkonen发表了论文《On-line construction of suffix ...原创 2019-12-03 14:12:05 · 503 阅读 · 0 评论 -
算法导论之图算法--图的基本概念
是数据结构和算法学中最强大的框架之一(或许没有之一)。用途:1、用来表现所有类型的结构或系统2、交通网络3、通信网络4、下棋游戏5、最优流程6、任务分配7、人际交互网络。。。。。。下面首先介绍一下图论的基本概念,对其有基本了解之后再在实践中加深理解。图是将各种模型抽象成一些顶点,这些顶点之间可以通过图的边实现连接,即vretex和edge,如下图所示圆圈中的顶点和黑色的边:一、顶点电路图中电路元件...原创 2018-04-13 10:24:47 · 3446 阅读 · 1 评论 -
算法导论之图算法--图的表示方法
图的表示有两种方式:1、图的邻接表2、图的邻接矩阵两种方法都可以表示有向图和无向图。左图是一个图,中间图是左图的一个邻接表表示,右图是左图的的邻接矩阵表示。这里用1和0表示两个顶点之间是否是连接的。下面是一个有向图的两种表示方法:可以看出来:无向图的邻接矩阵是对称的,对此种图的表示可以用一个上三角矩阵形式表示,减少一半的存储空间。对邻接矩阵和邻接表稍作修改,把u和v之间的边权重存储在u和v对应的邻...原创 2018-04-13 16:25:16 · 664 阅读 · 0 评论 -
jsoncpp安装包使用
想对{"word": "以下", "offset": [52], "weight": -4.80665e+062},{"word": "商品", "offset": [15], "weight": -4.89186e+062}类似的字符串进行拆分,发现字符串加上[]中括号后,就和json字符串规则相似,故想到用json方式拆分字符串到相应的数据结果中原创 2018-10-08 19:34:04 · 709 阅读 · 0 评论 -
Trie(前缀树/字典树)及其应用
Trie,又经常叫前缀树,字典树等等。它有很多变种,如后缀树,Radix Tree/Trie,PATRICIA tree,以及bitwise版本的crit-bit tree。当然很多名字的意义其实有交叉。 定义在计算机科学中,trie,又称前缀树或字典树,是一种有序树,用于保存关联数组,其中的键通常是字符串。与二叉查找树不同,键不是直接保存在节点中,而是由节点在树中的位置决定。一个节...转载 2018-10-17 13:44:36 · 479 阅读 · 0 评论 -
ipynb文件转py文件
1、使用pip安装jupytercmd 中 输入 pip install jupyter命令2、cd 到ipynb文件路径3、使用命令 jupyter nbconvert --to script *.ipynb原创 2019-01-25 10:33:30 · 2862 阅读 · 0 评论 -
python笔记之ZipFile模块
zipfile模块用来做zip格式编码的压缩和解压缩的,zipfile里有两个非常重要的class, 分别是ZipFile和ZipInfo, 在绝大多数的情况下,我们只需要使用这两个class就可以了。ZipFile是主要的类,用来创建和读取zip文件而ZipInfo是存储的zip文件的每个文件的信息的。 比如要读取一个Python zipfile 模块,这里假设filen...转载 2019-01-25 14:03:59 · 136 阅读 · 0 评论