TF-IDF是一种常用的文本特征提取方法,可以用Python来实现。
首先,计算每个单词在文档中的词频(TF):
def compute_tf(text):
tf_text = {}
for word in text.split():
tf_text[word] = tf_text.get(word, 0) + 1
return tf_text
TF-IDF是一种常用的文本特征提取方法,可以用Python来实现。
首先,计算每个单词在文档中的词频(TF):
def compute_tf(text):
tf_text = {}
for word in text.split():
tf_text[word] = tf_text.get(word, 0) + 1
return tf_text