一、前言
前文介绍了词权重的计算方法,本篇介绍词权重的另一种应用:文本相似度计算。
二、算法原理
文本相似度计算的方法很多,我们这里通过计算“两篇文本中都出现的词汇的权重占比”来衡量相似的程度,具体计算公式如下:
词的权重利用前文中的公式获得:
一、前言
前文介绍了词权重的计算方法,本篇介绍词权重的另一种应用:文本相似度计算。
二、算法原理
文本相似度计算的方法很多,我们这里通过计算“两篇文本中都出现的词汇的权重占比”来衡量相似的程度,具体计算公式如下:
词的权重利用前文中的公式获得: