wordTree笔记

public class WordTree extends HashMap<Character,WordTree>

DFA(Deterministic Finite Automaton 确定有穷自动机)
DFA单词树(以下简称单词树),常用于在某大段文字中快速查找某几个关键词是否存在。

单词树使用group区分不同的关键字集合,不同的分组可以共享树枝,避免重复建树。 单词树使用树状结构表示一组单词。

例如:红领巾,红河构建树后为:

/
领 河
/

其中每个节点都是一个WordTree对象,查找时从上向下查找。

WordTree是一个词集之间的树形结构,通过语义范围确定节点上下级关系

如:Norfolk terrier从上到下的节点依次为 physical object、animal、mammal、hunting dog、terrier、Norfolk terrier。语义范围从大到小。

使用WordTree结构预测时,每个节点下的所有子节点,构成了一个同义词集,对所有的同义词集求softmax得到的就是条件概率。

分类时假设图像有一个物体,即
P r ( N o r f o l k t e r r i e r ) = P r ( N o r f o l k t e r r i e r ∣ t e r r i e r ) ∗ P r ( t e r r i e r ∣ h u n t i n g d o g ) ∗ P r ( m a m m a l ∣ a n i m a l ) ∗ P r ( a n i m a l ∣ p h y s i c a l o b j e c t ) Pr(Norfolk terrier)=Pr(Norfolk terrier ∣ terrier)∗Pr(terrier ∣ hunting dog)∗Pr(mammal ∣ animal)∗Pr(animal ∣ physical object) Pr(Norfolkterrier)=Pr(Norfolkterrierterrier)Pr(terrierhuntingdog)Pr(mammalanimal)Pr(animalphysicalobject)

这样再输出时可以根据阈值选择输出的层级,如上式中,预测时,后面条件概率较低,可以只输出dog而不必输出更小的层级类别。

训练时,扩展为多label,从wordTree中当前节点开始,向上所有层级的父节点都成为此样本的label。如一个label为Norfolk terrier,它同时获得dog、mammal等label。

图像1:
在这里插入图片描述
图像2:
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值