维特比算法

本文介绍了维特比算法在寻找序列最短路径中的应用,并探讨了词袋模型和Hash Trick在文本向量化过程中的作用。维特比算法用于解决HMM解码问题,而词袋模型和Hash Trick则在文本特征处理中起关键作用,Hash Trick通过降维避免内存溢出,但牺牲了解释性。
摘要由CSDN通过智能技术生成

维特比算法是用于隐式马尔科夫模型HMM解码算法的,但是它是一个通用的求序列最短路径(动态规划)的方法,不光可以用于HMM,也可以用于其他的序列最短路径算法,比如最优分词。

 

维特比算法需要找到从Start到End之间的一条最短路径。对于在End之前的任意一个当前局部节点,我们需要得到到达该节点的最大概率δ,和记录到达当前节点满足最大概率的前一节点位置Ψ。P(生|人)=0.17(在“人”为前一节点,后续连续节点为“生”的概率为0.17)。

维特比算法需要找到从Start到End之间的一条最短路径。对于在End之前的任意一个当前局部节点,我们需要得到到达该节点的最大概率δ,和记录到达当前节点满足最大概率的前一节点位置Ψ。

 

向量化和特例Hash Trick

做了分词后,如果我们是做文本分类聚类,则后面关键的特征预处理步骤有向量化或向量化的特例Hash Trick。

词袋模型(Bag of Words,简称BoW)

假设我们不考虑文本中词与词之间的上下文关系,仅仅只考虑所有

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值