算法
汲建帅
这个作者很懒,什么都没留下…
展开
-
HashMap实现中文分词器
今天下午部门内部技术分享是分词器算法。这次的主讲是大名鼎鼎的Ansj分词器的作者-孙健。 作者简介: 1. Ansj分词器作者 2. elasticsearch-sql(elasticsearch的sql插件)作者,支持sql查询 3. nlp-lang自然语言工具包发起人 4. NLPCN(自然语言处理组织)发起人 等等… 网站:http://www.nlp原创 2017-05-15 17:28:13 · 2090 阅读 · 0 评论 -
高亮标红
简单实用,哈哈。 转载原文地址:点击这里import java.io.File;import java.io.FileOutputStream;import java.io.IOException;import java.io.OutputStreamWriter;import java.util.Comparator;import java.util.HashSet;import j原创 2017-08-21 15:47:25 · 1969 阅读 · 0 评论 -
Trie Tree 实现中文分词器
前言继上一篇HashMap实现中文分词器后,对Trie Tree的好奇,又使用Trie Tree实现了下中文分词器。效率比HashMap实现的分词器更高。Trie Tree 简介Trie Tree,又称单词字典树、查找树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:最大限度地减少无原创 2017-05-17 23:58:20 · 4660 阅读 · 2 评论 -
聚簇索引和二级索引
聚簇索引索引和数据存储在一块( 都存储在同一个B*tree 中)。 一般主键索引都是聚餐索引 Mysql中InnoDB引擎的主键索引为聚簇索引,MyISAM存储引擎采用非聚集索引非聚簇索引索引数据和存储数据是分离的。二级索引(辅助索引)二级索引存储的是记录的主键,而不是数据存储的地址。以Mysql的InnoDB为例 主键是聚集索引 唯一索引、普通索引原创 2018-01-17 14:29:50 · 8868 阅读 · 1 评论 -
数据库索引为什么使用B+树?
概述B tree: 二叉树(Binary tree),每个节点只能存储一个数。 **B-tree:**B树(B-Tree,并不是B“减”树,横杠为连接符,容易被误导) B树属于多叉树又名平衡多路查找树。每个节点可以多个数(由磁盘大小决定)。 B+tree 和 B*tree 都是 B-tree的变种索引为什么是用B树呢?一般来说,索引本身也很大,不可能全部存储在内存中,因此索原创 2018-01-17 14:28:46 · 3113 阅读 · 0 评论 -
RSA 非对称加密原理(小白也能看懂哦~)
RSA 加密原理 步骤 说明 描述 备注 1 找出质数 P 、Q - 2 计算公共模数 N = P * Q - 3 欧拉函数 φ(N) = (P-1)(Q-1) - 4 计算公钥E 1 < E < φ(N) E的取值必须是整数 E 和 φ(N) 必须是互质数 5 计算私...原创 2018-06-05 15:35:09 · 106158 阅读 · 25 评论 -
凯撒加密算法(最简单的对称加密)
凯撒算法 概述凯撒密码是罗马扩张时期朱利斯• 凯撒(Julius Caesar)创造的,用于加密通过信使传递的作战命令。它将字母表中的字母移动一定位置而实现加密。例如如果向右移动 2 位,则 字母 A 将变为 C,字母 B 将变为 D,…,字母 X 变成 Z,字母 Y 则变为 A,字母 Z 变为 B。 因此,假如有个明文字符串“Hello”用这种方法加密的话,将变为密文: “Jgnnq...原创 2018-06-05 15:36:27 · 15884 阅读 · 0 评论