- 博客(1)
- 收藏
- 关注
原创 TF-IDF特征提取 用sklearn提取tfidf特征
n-gram此处的TF和IDF的公式,都是sklearn中的tfidf使用的公式。和最原始的公式会有些出入。并且根据一些参数的不同而不同。名词的解释: corpus:指所有documents的集合 documents:词语的有序排列。可以是一篇文章、一个句子之类。词频(TF)在一份给定的文件里,词频(term frequency,tf)指的是某一个给定的词语在该文件中出现的频率。这个数字是对词数
2017-07-09 20:12:04 17053 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人