机器学习-nlp-sklearn进行关键词提取(基于tfidf)
背景tfidf相对词频可以很好的反应出文本中的关键词。本文将使用sklearn进行关键词提取。实战结巴分词使用pandas读取csv文件内容遍历titile内容进行分词加载停用词遍历进行停词使用sklearn的TfidfVectorizer对文本进行向量化tfidf.toarray()转换成为矩阵,然后进行行排序,取最后的n个索引(argsort是拿到索引值)通...
原创
2020-01-02 21:40:12 ·
5165 阅读 ·
0 评论