tf-idf 的简要介绍:
tf:term frequency。某个关键词在整篇文档中出现的频率
idf:inverse document frequency。逆文档频率。某个词在所有文档中出现的频率。
tf 公式:
t f i j = n i j ∑ k n k j tf_{ij} = \frac{n_{ij}}{\sum_k n_{kj}} tfij=
tf-idf 的简要介绍:
tf:term frequency。某个关键词在整篇文档中出现的频率
idf:inverse document frequency。逆文档频率。某个词在所有文档中出现的频率。
tf 公式:
t f i j = n i j ∑ k n k j tf_{ij} = \frac{n_{ij}}{\sum_k n_{kj}} tfij=