TD-IDF
什么是 TF-IDF 算法?
简单来说,向量空间模型就是希望把查询关键字和文档都表达成向量,然后利用向量之间的运算来进一步表达向量间的关系。比如,一个比较常用的运算就是计算查询关键字所对应的向量和文档所对应的向量之间的 “相关度”。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gP4gwlKB-1589524736752)(imgs/TF-IDF.png)]
TF (Term Frequency)—— “单词频率”
意思就是说,我们计算一个查询关键字中某一个单词在目标文档中
原创
2020-05-15 14:39:38 ·
2326 阅读 ·
0 评论