计算文本相似度方法总结(二)

总览

1252882-20190515144720450-1402895338.png

1.基于语料库

1252882-20190515144738690-1175625286.png

(1)词袋模型

VSM

1252882-20190515144749893-2100306903.png

LSA

1252882-20190515144756511-1376172492.png

PLSA

1252882-20190515144803004-1977462328.png

LDA

1252882-20190515144809428-1416911411.png

(2)神经网络

1252882-20190515144822943-298982487.png

(3)搜索引擎

1252882-20190515144828882-850351510.png

2.基于字符串

(1)基于字符

1252882-20190515144835381-810544408.png

(2)基于词语

1252882-20190515144843035-923992957.png

3.基于世界知识

(1)基于本体

1252882-20190515144849585-1828441400.png

(2)基于网络知识

1252882-20190515144855347-1619540393.png

4.其他方法

(1)句法分析

1252882-20190515144905837-137722247.png

(2)混合方式

1252882-20190515144914777-2026374250.png

参考文献:

【1】文本相似度计算方法研究综述 Review of Studies on Text Similarity Measures

转载于:https://www.cnblogs.com/nxf-rabbit75/p/10869402.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值