nlp
文章平均质量分 57
JECK_ケーキ
这个作者很懒,什么都没留下…
展开
-
python计算tfidf sklearn计算
利用python 计算文档的tfidf,步骤大概如下:读入文档,对文档进行分词,每一段为一个字符串,分词用空格隔开,读入文档是一个长度为该文档段数的列表。利用vectorizer生成词频矩阵X , 再利用tfidftransformer 生成tfidf矩阵。代码如下:import jiebaimport numpy as npfrom sklearn import feature_extractionfrom sklearn.feature_extraction.text impor原创 2020-12-23 09:41:22 · 1159 阅读 · 0 评论 -
python制作词云图
之前一直做词云图,没有总结,今天重新做了一遍,代码放上,免得以后找不到。import pandas as pdimport numpy as npimport reimport matplotlib.pyplot as pltfrom wordcloud import WordCloudimport osimport jiebafrom collections import Counter#必须指定字符位置,否则乱码fontpath = 'C:\\Windows\\Fonts\\sim原创 2020-12-15 09:09:13 · 375 阅读 · 1 评论