自然语言处理(NLP)[文本挖掘算法]:TF-IDF分析
自然语言处理(NLP)中有一块很重要的部分就是文本挖掘,文本自然语言的一种展现形式,也是目前海量数据的主流展现方式。现在google和百度也会采用主流的分词算法TF-IDF进行文本拆分,当然这是主要的算法之一,不是只是用这一种。下面我给大家简单介绍一下TF-IDF算法:
定义
在信息检索中,TF-IDF(词频-逆文档频率)是一种统计方法,用以评估一个单词在一个文档集合或语料库中的重要程度。经常被用...
原创
2019-11-26 11:56:16 ·
2748 阅读 ·
0 评论