JAVA实现数据结构:字典/哈夫曼/线段树

文章目录字典树(Trie树)哈夫曼树(最优二叉树)线段树字典树(Trie树)定义又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。性质它有3个基本性质:根节点不包含...
摘要由CSDN通过智能技术生成


在这里插入图片描述

字典树(Trie树)

在这里插入图片描述

  • 定义
    又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。
  • 性质
    它有3个基本性质:
    根节点不包含字符,除根节点外每一个节点都只包含一个字符;
    从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串;
    每个节点的所有子节点包含的字符都不相同。
  • 实现方法
    搜索字典项目的方法为:
    (1) 从根结点开始一次搜索;
    (2) 取得要查找关键词的第一个字母,并根据该字母选择对应的子树并转到该子树继续进行检索;
    (3) 在相应的子树上,取得要查找关键词的第二个字母,并进一步选择对应的子树进行检索。
    (4) 迭代过程……
    (5) 在某个结点处,关键词的所有字母已被取出,则读取附在该结点上的信息,即完成查找。
    其他操作类似处理
  • 应用
    串的快速检索:
    给出N个单词组成的熟词表,以及一篇全用小写英文书写的文章,请你按最早出现的顺序写出所有不在熟词表中的生词。
    在这道题中,我们可以用数组枚举,用哈希,用字典树,先把熟词建一棵树,然后读入文章进行比较,这种方法效率是比较高的。
    “串”排序:
    给定N个互不相同的仅由一个单词构成的英文名,让你将他们按字典序从小到大输出
    用字典树进行排序,采用数组的方式创建字典树,这棵树的每个结点的所有儿子很显然地按照其字母大小排序。对这棵树进行先序遍历即可。
    最长公共前缀:
    对所有串建立字典树,对于两个串的最长公共前缀的长度即他们所在的结点的公共祖先个数,于是,问题就转化为当时公共祖先问题。
  • 实现
package 数据结构;

public class Trie {
   
	private int SIZE = 26;// 每层26个单词
	private TrieNode root;// 字典树的根

	Trie() // 初始化字典树
	{
   
		root = new TrieNode();
	}

	private class TrieNode // 字典树结点
	{
   
		private int num;// 有多少单词通过这个结点,即由根至该结点组成的字符串模式出现的次数
		private TrieNode[] son;// 所有的儿子结点
		private boolean isEnd;// 是不是最后一个结点
		private char val;// 结点的值
		private boolean haveSon;// 有无子结点

		TrieNode() {
   // 初始化结点
			num = 1;
			son = new TrieNode[SIZE];
			isEnd = false;
			haveSon = false;
		}
	}

//建立字典树
	public void insert(String str) // 在字典树中插入一个单词
	{
   
		if (str == null || str.length() == 0) {
   
			return;
		}
		TrieNode node = root;
		char[] letters = str.toCharArray();
		for (int i = 0; i < str.length(); i++) {
   
			int pos = letters[i] - 'a';
			if (node.son[pos] == null) {
   
				node.haveSon = true;
				node.son[pos] = new TrieNode();
				node.son[pos].val = letters[i];
			} else {
   
				node.son[pos].num++;
			}
			node = node.son[pos];
		}
		node.isEnd = true;
	}

//计算单词前缀的数量
	public int countPrefix(String prefix) {
   
		if (prefix == null || prefix.length() == 0) {
   
			return -1;
		}
		TrieNode node = root;
		char[] letters = prefix.toCharArray();
		for (int i = 0, len = prefix.length(); i < len; i++) {
   
			int pos = letters[i] - 'a';
			if (node.son[pos] == null) {
   
				return 0;
			} else {
   
				node = node.son[pos];
			}
		}
		return node.num;
	}

//打印指定前缀的单词
	public String hasPrefix(String prefix) {
   
		if (prefix == null || prefix.length() == 0) {
   
			return null;
		}
		TrieNode node = root;
		char[] letters = prefix.toCharArray();
		for (int i = 0, len = prefix.length(); i < len; i++) {
   
			int pos = letters[i] - 'a';
			if (node.son[pos] == null) {
   
				return null;
			} else {
   
				node = node.son[pos];
			}
		}
		preTraverse(node, prefix);
		return null;
	}

// 遍历经过此结点的单词.
	public void preTraverse(TrieNode node, String prefix) {
   
		if (node.haveSon) {
   
			for<
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值