- 博客(1)
- 收藏
- 关注
原创 TF-IDF(词频-逆文件频率)
TF-IDF是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。**字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。**即一个词语在一篇文章中出现次数越多, 同时在所有文档中出现次数越少, 越能够代表该文章.词频 (term frequency, TF)TF指...
2019-03-26 10:52:41 2124
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人